旭駅本屋

SNSが普及しきった今日において、人々はなぜブログを使うのであろうか。

RSS

 

情報化社会

おはこんばんちわ。筆者です。

ところで読者諸兄の皆様は普段どれくらいの量のデータと対峙していますか?1Bit?1Word?1GB?1TB?仕事なら兎も角プライベートだと本当に差がついてくる分野だと思います。ちなみに筆者は2~3TB程度です*1。ファイル数としては200万程度でまあ、趣味でもないとやってられないなって感じです。はい。仕事だったら渡された瞬間きがくるうと思う。

しかしですね、この気が狂う程のデータ量が情報化社会、ひいては今話題のAIやBIの分野になってくると思うわけです。

情報、基本的に残りません。

これ、近代史なりを多少齧っていればわかると思うんですが、一次情報は近い時代のものであれ極めて手に入れることが難しいものなのです。思い当たる節が多分にある筆者も居るでしょうし、そうでない読者であれたかだか26話の男はつらいよのテレビドラマ時代の映像が殆ど残っていないことなどを鑑みれば明らかでしょう*2。というか本当に芳文社アニメのCMが放映されるだけで終わってるのつらすぎる。アーカイブしてくれ。課金するから。

そういうわけで、基本的に情報は残らないしほしい情報は掴んだら掴み続けないと手に入らないのです。何だよこの社会。情報化社会、映像の世紀ではなかったのか……。

そういう理由から基本的にクソ丁寧にアーカイブしてかつ検索性をウインドズーにしては極限まで高めているはずなのですが、それでも結構限界はあるのです。タグ付けを面倒くさいとかXPでは実装されてなかったからとかそういう理由で放置して一切検索出来なくなってるあたりとかにその一端は現れています。Pixivとかニコニコ動画とかビリビリとかの人的リソースを無限に供給してあらゆるラベリングを施せるサービスってホンマに強いなって思います。だって個人で1ファイルに10個ずつタグつけるとか正気じゃないですし。特に数百万ファイルがあるなら尚の事。

 

日常的にこれは薄々処理している情報量が多すぎるのではないかと感じていたのですが、その疑念が確信に変わったのはDropbox Professionalに契約したところで2TBまでしかファイルが保存できないというところからでした。普通足りると思うよね2TBって。でも足りないんだよね2TB。バックアップにしては心許ないし確信的なデータのみなら無料枠にWindowsを構成している有象無象をいい具合に濃縮したessenceを残せばいいだけの話であって微妙な2TBという容量に手を出すのは今ひとつ食指が伸びない。Googleフォトの無尽蔵無課金枠も機械学習のアルゴにより幾つかのゴミと判断されたゴミが弾かれるのでこれも確信的なバックアップとして利用するには心許ない。フォルダ構成が引き継がれないのも尚の事である。そもそも機械学習アルゴリズムって日進月歩だし、今日弾かれたのが明日弾かれないとは限らないしそんなもので弾かれて保存されないのは流石に横暴過ぎひん?とは思うものです。保存したあとサジェストで弾くならまだわかるけど。アップロード時に棄却するのはちゃうやろと。

というわけで、微妙にフルバックアップがとれないデータ量と格闘している*3パーソンとしては、情報化社会の情報の洪水と言わんばかりのものに揉まれているっぽさそうな人を見るとなんだかなぁと思うわけであります。

ちなみに、これはAIやBIの話にも言えることで、ストレージやデバイスの低廉化で軽率にデータが取れてかつ残せるようになった現代において、ありとあらゆるデータを保管し加工し何かを見つけていくのがビッグデータの領域だと思うわけであります。であるならば、データはあるからとあぐらをかいて、上辺だけの標本で満足しているどころかそれですらノイズが多いとのたまう市民の皆々様はとても情報化社会やビッグデータというものについて理解も本質に迫ることも出来ずにただただ無為にデータを破棄し終わるだけなのではないかと思うものであります。

だって皆さん、例えば家にしまってあるアルバムなんて大掃除の時か節目でしか見ないでしょう?それ全部毎日見て共通点探すようなのが機械学習って奴ですよ?ちゃんと理解してますか?あわよくば元のフィルムごと捨てようとしてません?再度現像し直して当時は判別出来なかったものをみたいなのをやるのがビッグデータってもんですよ?データ詰むだけ詰んだままGAFAが喉から手が出るほど欲しがってるわガハハとか言ってませんか?

*1:日常的に検索してすぐ取り出したいデータ量として。アーカイブ的なものを含めると20TB程度になる。

*2:第一話と最終話は残っているらしい。

*3:アーカイブファイルを除いた段階で