昨日届いていたVista β2をインストールしてみた。インストーラもこれまでで最高に出来が良い。45分ぐらいで完了。
クラッシュしてハードディスクだけ交換して、Vine Linuxをインストールしたままになっていた元XPマシンをCD/DVDブートが最初になるようにBIOSを設定しなおし、DVDからインストーラを起動する。そこにいくまでに少し手間取ったが、こんなもんだろう。手早くF2を押さないとHDDからLinuxが立ち上がってしまう。案の定、HDDが優先のブート設定になっていた。マシンのスペックは、Celeron 2.40GHz + 512MB RAMだ。
ネットワークやインターネットへの接続はほとんど何もしなくてよい。コマンドプロンプトを探して、ipconfigでIPアドレスを調べて、メインマシンのApacheにアクセスできるようにhttpd.confに設定する。IE 7はAtomを読み込むと単にパースして表示するのではなくて、HTMLに変換して格好よく表示してくれる。僕はソースを見たいのだけど、notepadの表示になる(^^;)フォントの質感がよくて高級感がある。
Windows Media Playerを起動すると、気が利いていて、豊富な本格的なサンプルがあるので、スピーカもつないで聴いてみた。音も出る(^^;)
画面のコピーを取るために、Gimpをインストールしてみた。Zipは解凍できる。ファイル共有設定も簡単。問題ない。Google Desktopもインストール。デザインはよいが、残念ながら革新がどこにあるのかが問題である。できることは変わらないからだ。IE 7の操作ボタンは上部にまとまり、よくなった。
Windows Vista Beta 2 Build 5384最近、小さなPost-itを本のおもしろいなと思う部分に必ず貼り付けるようにしている。こんなことが書いてあった筈だよなと思って、本を捲ってもなかなかその場所を見つけられないからだ。やれやれ、まだ探している部分がある。
会社の若い友人から、「Google Earthを見られましたか。すごいですよ。」と聞かれて、高解像度化したという話があったけど、「そう言えば、見てないな」と昨日確認。広島も高解像度で見れるようになっている。今日は、Google MapsのSattelite表示はどうなっているんだろうと確認。ver.1は古いまま。なるほど、ver.2への移行を促そうということか。マークが写真上に表示される、確かにこれは便利。
Walking World Project: Google Maps ver.2 sattelite画面今朝は強い雨が降る中を車を走らせた。一時は前が見えなくなるぐらいだった。昼には雨が上がり、低く垂れ込めた雲と霧も裾を切って宮島の沿岸部を黒く浮き立たせた。
中学生や高校生の頃、古文や漢文は、現代社会において実用的な意味がないという理由であまりまじめに勉強しなかった。今それを少し後悔している。せっかくならもっとしっかり勉強しておけばよかったと思う。養老孟司+王敏著、「君子の交わり、小人の交わり - 日中関係を90度ずらす」中公新書ラクレ 217、中央公論新社、2006年6月10日、222ページ、700円には、中国の昆虫関係の文献も読める養老孟司がいる。漢文を書き下して読むという芸当がお出来になるらしい。日本の歴史を紐解こうと思えば、古文・漢文の素養は必須だろう。なんらかの形で古文・漢文のおもしろさを実感できればね。
昨日から雨が続けて降っている。CodeZineの「デスクトップCGIによるWebとデスクトップの融合 第2回 - Web日記のAtom配信」に関する原稿をようやく書き上げてメールで送った。最近様々な本を読みながら、学校で学んだ歴史の知識が薄っぺらなためにほとんど役に立たないことに愕然とし、新しく得た知識を整理して、適切な歴史認識に到達すべきだろうと思い始めた。
これは口で言うほど簡単なことではないが、具体的には、ミシェル・フーコー(1926-1984)の「知の考古学」(1969)は読み解くべき本であると感じていて、ここにはゾクッとする予感か何かがあり、これを読み解くための勉強をしようということにした。しかし、まだ答えを書かないうちに彼は死んだのかもしれないが・・・
第二の波である産業革命(1760年代-1830年代)と認識論を相対的なものにしたカント(1724-1804)についてWikipediaを調べた。カントはニュートン(1642-1727)の自然科学の影響を強く受けている。自然科学によって、認識論も変わったのだろうか。フーコーは「哲学と心理学」(1965)でこれに言及していて、最後に次のように述べている。
・・・つまり完全に不可避的で宿命的な一種の袋小路、十九世紀における西欧の思考がとらわれた一種の袋小路としての心理学に。しかし、それが全く不可避的で宿命的なひとつの袋小路であると語りつつも、私は心理学を科学として批判したりはしないでしょう。私は心理学があまり実証的とは言えぬひとつの科学であるとも、それがより哲学的あるいはより非哲学的な何かであらねばならぬとも言わないでしょう。私はただ単に、次のように言うことでしょう。一種の人間的な眠りがあって、そこで哲学と人間諸科学とがいわば互いに魅惑され眠りに導かれたのだ、そして、かつて独断論の眠りから眼をさましたように、我々は、この人間的な眠りから目を覚まさねばならないのだと。(フーコー・コレクション1 狂気・理性、ちくま学芸文庫、317ページ)
家内が読んでいた「音遊人」(「みゅーじん」と読ませる)、ヤマハ、August 2006、創刊3号(偶数月刊)、142ページ、552円、を覗いていると、MP3 MIXING RECORDER SoundSketcher SH-01の広告があったので調べた。YAMAHA feelin' clubの会員情報誌『音遊人』なのか・・・ホームページはまだ創刊2号のまま^^;
おもしろいけど、もうHi-MD MZ-RH1([Media] Hi-MD Walkman)を買っちゃったし(^^;)
フォーサイト7月号には、「グーグルに対抗する仏政府主導の検索エンジン「クエロ」計画とは」という記事があり、exaleadという検索エンジンに言及している。垢抜けたデザインの検索サイトやツールバーもある。日本語の検索も可能だが、得られる結果は期待した結果とはほとんど異なる。日本語のインデックスの作成の仕方がおかしいと思われる。Advanced Searchのインターフェースはおもしろいけど、現時点ではGoogleに替えて使うことにはならない。
Exalead最近、インターネット-グーグル覇権に挑む:IT-PLUSの連載が組まれている。
究極的には、検索エンジンに求められるのは網羅性である。存在しないものを検索結果として得ることはできないからである。後は用語の組み合わせで検索するかぎり、実質的には同じ結果が得られるはずである。問題は検索結果の数が膨大な場合に見るものを如何に絞り込むかということになるのだが、通常は検索語をAND演算で追加することによって行う。しかし、この方法には限界がある。そこで検索結果の上位に表示させるものを選び出すのが、PageRankという実用的な尺度である。サイトのリンクの孫引きも大変有効な手法になる場合を経験することは多い。この情報はこのサイトに行けばよいとか、こちらはこっちのサイトがよいとか、次第にそのような知識がWebに蓄積されていくはずである。そういう意味では知識がハイパーリンクで自己組織化されていく。放っておけば、ユーザーが検索エンジンを使って働いてくれるのである。ユーザーが使えば使うほど、便利になる性質がWebにはあるだろう。
GoogleのようなPageRankによって上位に表示するページの順位付けをする検索エンジンばかりを使えば、上位に表示されたものへのリンクがより増大する傾向が生じることは言うまでもない。どの程度まで上位の結果を利用すべきかは、中味を見て自分で判断するしかないが、トップページの上位のものだけに注目するのは危険かもしれない。
スラッシュドット ジャパン | 今現在、計算機系で良く読む雑誌はなんでしょうかネタ。
新しいテキストが、過去にあるテキストの単なる変形あるいは分割・統合でしかなければ、何の進歩もないわけで、そこに新しい意味を創造しなくてはならない。ジャーナリズムは困難な時代になったのかもしれない。今や、検索エンジンを使えば重要なサイトは簡単にリストアップできて、オリジナルを誰もが容易に見ることができるからだ。
最近は、まったくと言ってよいほどソフトウェア・PC関連の雑誌は買わなくなった。山ほど本を持っているので、大概のことは調べることができる。最新情報はWebから得る。雑誌の速報性や動向の解説にあまり魅力がなくなった。情報処理学会と人工知能学会の学会誌が届いても当初はものめずらしく読んでいたが、最近はパラパラ捲る程度でほとんど見ない。トレンドはわかるけど、実用性がない。
時折、思い出したように読むのは、新潮社の「フォーサイト」だが、政治・経済・ビジネス誌である。今年も購読を継続することにした。新聞やテレビのニュースからは得られない深部の情報が得られるからである。昨年は年に3回、講演会を収録したCDが送られてきた。今年も既に2回来た。これを車で聴くのが楽しみになっている。フォーサイトは100ページあまりの雑誌だが、定期購読のみで、12,000円/12冊の条件。けっして安くはないが、記事の質は高いし、フォーサイト・クラブ・セミナーのCDの配布などでお買い得と思う。結局、雑誌は執筆者を如何に揃えるかに浮沈が掛かっているといえるだろう。
アルビン・トフラー、ハイジ・トフラー著、山岡洋一訳、「富の未来」上、講談社、2006年6月7日第1刷、376ページ、1900円。アルビン・トフラー、ハイジ・トフラー著、山岡洋一訳、「富の未来」下、講談社、2006年6月7日第1刷、357ページ、1900円。データ形式としては、二つに分けとかないと。新大阪店のdanで購入。また買ってしまった。最近、本を買い過ぎ(^^;)
第三の波の行方は・・・最近、ミシェル・フーコーの「知の考古学」を読みながら、なぜこのような本を書く必要があったのかと考えていた。ほんの少し前、浜松町のdanで「フーコー・コレクション1 狂気・理性」と「フーコー・コレクション2 文学・侵犯」を購入している。トフラーによれば、10000年前に農業が始まり、17世紀後半に工業社会が到来する。そして今、第三の波、知識社会が大きな波に成長し、波頭は砕け散ろうとしているのかもしれない。工業社会の登場と軌を一にして都市化が進む。これはここ200-300年程度の変化の話である。フーコーの人間学の話も第二の波以降の変化に関するものである。養老先生の脳化社会の話も同様である。すべては連関している。少し歴史的経緯を整理してみたい。
最初はよくある話、DTIのWebkitの掲示板が他のサイトのページからアクセスできない設定になったのかなと思った。当面、DTIサイトのUNDESIGN版でしのぐしかないかなと切り替えたりして、チェックを続けたのだが、Firefoxが応答しなくなった。
おそらくハングしたのだろう。何度クリックしても開けない。結局、落ちてしまった。Windowsを再起動すると問題なく、サポートサイトから開けた。Firefoxは画面をへんなタイミングでマウスで弄ると異常終了することを度々経験している。
Google記事3題。興味があるのは音声検索技術である。音声が検索できるということは音声から文章が起こせるということである。これもOCR(Optical Character Recognition)と同様に精度の問題がどの程度かということにあるが、目指すべき方向だろう。
ケーブルテレビ2006 - 高機能化が進むSTB (MYCOMジャーナル)ネタ。
先日、CATVをデジタルコースに変更した時に、セットトップボックスという言葉を使うと「よくご存知ですね」と言われた。業者はチューナーという表現を最初はしていたのだが、説明をするときにSTBといっても一般ユーザーのほとんどは馴染みのない言葉だからだ。これからはSTBもHDD内蔵になるのかな。すごい時代になる。業者のサポートも大変なことは間違いない。2台のSTBをセットして使用説明をするだけで半日掛りの作業になる。ほとんど使うこともないVHSビデオデッキの録画も自動で予約できるらしい。居間でゆっくりテレビを見ている余裕はほとんどないのだが・・・
PCオーディオに関連して、Windows Media Playerの動向を確認すると、11βが出ているのでダウンロード。なかなかデザインはいかしている。Larry Wallのトークを写真と一緒にまとめてみた。このようなことはiTunesでも容易にできる。
Larry Wall on Windows Media Player 11βオンキヨー、PCとワイヤレス接続可能なコンパクトチューナーアンプなど発表 (MYCOMジャーナル)ネタ。
PCでオーディオをするなんて、少し前まで予想もしていなかったが、あっという間にiTunes+iPodが革新をもたらした。ただ、音質に関してはまだ疑問であるし、どういう方向でまとめるのがよいのか、コストを含めて落ち着き先を模索しているのが現状である。音楽と映像をWindows Mediaで持ちだそう - MSらがアキバなどでキャンペーン (MYCOMジャーナル)などの記事を見てもなにがなんだかよくわからない。オンキョーがモバイルを含めた高音質オーディオの解を提示してくれるとうれしいのだが。
ヤマハもネットワーク対応のAVレシーバを出したし、DENONのAVサラウンドアンプはPlaysForSureに言及して、iPodへの接続機能を提供する。
Sematics、数学的アプローチによる日本語解析エンジン「Perceptrons」開発 (MYCOMジャーナル)ネタ。
おもしろいものが現れた。数学で辞書もなしで文の意味が解析できるだろうか。大変興味深い。ググってみても吹谷和雄氏の情報が少ないが、意味位相空間理論を提唱されていて、位相空間の言語モデルでは単語の意味の多義性を吸収できるらしい。
国産検索エンジンに関連した記事もピックアップしておこう。
【レポート】Tech・Ed 2006 - 見えてきた2007年のMicrosoftのビジネス戦略 (1) 「People-Ready」構想実現に向けた製品ラインナップ強化 (MYCOMジャーナル)ネタ。
なるほど、このような構想に力を割いていたのかと思わせる話。実際的ではある。しかし、このような枠組みの有利性・有用性を、目に見えるような形で人に理解させ、納得させるのは大変困難だろうと思う。実用的なものにするためには、結局はカスタマイズする必要があるからであり、その部分の労力は膨大なものになり、その過程で混沌が忍び寄る。現実とはそのように定義しにくいものである。妥協の産物となる。カスタマイズする仕組みをどのように準備しているのかが、重要な部分だろう。
昨晩から嵌っていた更新日記Atom配信のエラー。
URLに含まれるCGIのパラメータを区切る「&」が実体参照の「&」と間違えられて、エラーになる問題をようやく解決できたかなと思っていたら(本質的な問題ではないのだけど)、昨日フランス語表記で初めて使った、文字表記文字実体「Ç」(Ç)、「É」(É)、「é」(é)がエラーになる。これらをエンコードして、HTMLに復元するときにデコードして取り扱うのは、非常に煩雑になる。preタグの間の部分はデコードしてはまずいし、その他の部分はデコードするというような仕組みを作る必要があるからだ。絡み合ったスパゲッティが解きほぐせないスパゲッティになりかねない(^^;)
オライリーのEric T. Ray著「XML入門」を調べてみたら、文字表記文字実体参照は、XMLではユーザーが定義して用いる必要がある。HTMLとの大きな違いである。これを避けて、Atom配信するためには、当面、HTMLにおいても番号表記の文字実体参照を用いておくのがよいという結論である。HTMLからAtomフィードへ変換して配信する汎用のスクリプトは、この点についても意識する必要がある。
IEとFirefoxではXMLの解析についても違いが多い。試しに文字表記文字実体をAtomフィードのXMLにDTDとして書き込んでみた時、存在しないURLでDTDを指定するとFirefoxはだまされてくれたが、IEは存在しないとエラーを出してきた。次のような場合である。
<!DOCTYPE feed SYSTEM "/xmlstuff/dtds/feeds.dtd" [ <!ENTITY Ccedil "&#199;"> <!ENTITY Eacute "&#201;"> <!ENTITY eacute "&#233;"> ]>
ここまで来たら、上記の文字表記文字実体参照の定義をDTDにして、試してみよう。「Ç」(Ç)、「É」(É)、「é」(é)。AtomフィードのXML宣言行の直後に、次の行を出力し、実際にfeeds.dtdを作成して、指定のURLに置く。
<!DOCTYPE feed SYSTEM "http://homepage1.nifty.com/kazuf/xmlstuff/dtds/feeds.dtd">
feeds.dtd
<!ENTITY Ccedil "&#199;"> <!ENTITY Eacute "&#201;"> <!ENTITY eacute "&#233;">
IE 6はfeeds.dtdをURLから実際に読んで解析しているらしくエラーにならない。Firefoxはまったく同じエラー、「XML パースエラー: 定義されていない実体が使用されています。」が出る。先の実験でFirefoxがエラーにならないのも、実際に読んでいないからだろう。このような仕組みをどこまで実装するかは考え方しだいである。完璧はなかなか難しい(^^;)IEは地道に実装している。
Firefoxのエラーの位置を指定した列番号は文字数を表している。半角文字の-^を使った位置の指示が合わない場合があるのはこのせいである。
おそらく、Firefoxの文字表記文字実体参照のXMLパースエラーは無視しない方がよいのだろう。読者が使用するAtomリーダーのXMLパーサーの実装がどの程度のものかによるわけだけど、rn2atom.cgiで、番号表記文字実体に変換しておくのが安全だろう。atom2html.cgiのパーサーでは多少の整形式エラーがあろうとパターンマッチで読み取るので問題にならない(^^)v
「知の考古学」の記事で引用文がルビだらけなので、ルビを使ってみた。Firefoxではルビ表示ができないので調べていたら、Mozillaでルビ表示3 - 徒書・2001年10月のページを見つけた。
このページのCSSを使わせていただくと、見事にFirefoxでもルビが表示できるが、何もなくても表示できるIEでは乱れてしまう。とうとう、我がページもブラウザ(navigator.userAgent)によって、読み込むスタイルシートを変更するようになった。最初適当にMozillaで判定していたら、おかしい。調べるとIEもMozillaの一種なんだねえ。思い起こすと、元はMosaicだから同根ではあるわけだけど。結局、navigator.userAgent.indexOf("Firefox")の場合にfirefox.cssを読み込むことに・・・ブラウザがルビに対応していなければ、()の中に表示する。
昨日は新幹線でビル・ゲイツが2008年6月にマイクロソフトを離れるというニュースを見た。Windowsは私のPC経験のすべてであり、PCプラットフォームである。MS-DOSからWindows 3.1、95、98、2000、XPを使ってきた。Windows 2000あたりから、使いやすい非常に優れたOSに成長したと思うが、残念ながら、Officeは自宅で本格的に使うには至らなかった。プライベートでは高価すぎたからだ。
Windows Vistaのできがどの程度のものか、大変楽しみだ。IE 7のデザインはなんとかしてほしい。オーソドックスでいいんだよ。
Open Tech Press | Linuxで使えるGoogle Earthネタ。
Picasaに続いて、Google EarthもLinuxに移植されている。Google Desktopが移植されれば、Linuxも選択肢に入ってくるが、PCユーザーとしてはどうすればいいのか・・・。標準デスクトップというか、Firefox/Thunderbird、OpenOffice.org、かな漢字入力変換システムやフォントなども含めたLinuxセットを誰か出すのだろうか。でも、わざわざ、WindowsからLinux環境に移るのも面倒だ。できることは結局、Windowsと同じじゃないとも思う。WindowsもOSさえあれば、後はすべてインターネットから揃えることができる。
Zazelさんから、先日、更新日記のAtomフィードが整形式違反のエラーになっているというメールをいただいた。
Firefoxのエラーメッセージによれば、エラーの部分はCodeZineの記事へのハイパーリンクの&であろうと思われた。なぜこれがエラーなのかなあと、HTMLサイドからは考えられる。なぜなら、&はURLの予約文字だからである。HTMLで文句を言われることはない。問題は、XMLの混在内容実体の内部実体参照の仕組みにあるのだろうと思われる。XMLのデータ記述で、「&this;」と書けば、例えば、「<!ENTITY this "<element>entity</element>">」の記述から設定値を呼び出すことができる。それで、&が、「&」の文字だけ、独立してあるのは整形式違反になるのだと思われる。
content要素にHTMLをXHTMLとして埋め込んでいるのだが、XML化が足りなかったということになる。エラーになるのは、aタグのhref属性値のURLではなく、単なる属性値と見做して、整形式をチェックしているからだろう。HTMLの実体参照記述以外の「&」は「&」に置換するようにコードを加えた。無論、デコードしないとリンクは有効にはならない。atom2html.cgiは整形式チェックをクリアしてもしなくても、必要であればデコードするのでどちらでも読めるが、リーダーによっては問題になるかもしれない。
Open Tech Press | 米Parallels:1台でMac 、Windows、Linuxを並行利用ネタ。
Pallarels DesktopMac-Windows間でコピー&ペーストができるそうだ。次のVistaが動くなら、次期マシンには、Intel Macも選択肢に入るかな。
吉本隆明氏の「読書の方法 - なにを、どう読むか」を読んでいると、ノン・ジャンル ベスト120の「現在を読む」の項で、一冊択べと言われたら、サルトルの「存在と無」かミシェル・フーコーの「言葉と物」を択ぶと書いてあって、「言葉と物」は持っていないので、「知の考古学」を引っ張り出して読み始めた。「言葉と物」の次に書かれたのが「知の考古学」である。更新日記流脳活性化トレーニングによって読む準備ができたのだろう(^^;)
すなわち、一冊の書物の周縁は、決してはっきりもしていなければ、厳密に区切りがついてもいない。表題、最初の数行、終止符などを越え、その内的ゲシュタルトやそれを自律化する形態を越えて、それは、他の書物、他のテキスト、他の文などの関係のシステムのうちに、つまり、網の目のうちにとらえられている。そして、この関係の働きは、数学上の論文、テキストの注釈、歴史的な物語、ロマネスクな作品群のなかの挿話などのいずれを対象とするかに応じて、類を異にする。同じく関係の束として理解された書物の統一性は、此処と彼処では、同一なものと見なされることはできない。書物は、人々の手中にある物体であると自称しても、無益である。同じく、それを閉じ込める小さな平行六面体に小さくまとまってみても、無駄である。その統一性たるや、可変的で相対的なものだからだ。ひとに問われるや否や、それは自己の明証性を失う。それは自己自身で示すことはできず、ただ、言説の複雑な領域から出発してのみ、自己を構築することができる。(ミシェル・フーコー著、中村雄二郎訳、「知の考古学」、河出書房新社、1978年6版、38-39ページ [原著: 1969年、Éditions Gallimard])
Webは書物の様々な読み方を提示することができる枠組みに発展する可能性があり、まさに関係の束をいかに示すかということにおいて価値があるのだろう。
・・・それはまた、新しい歴史学が、ただ単に、これらの相異なる歴史の間に、日付の一致や、形態および
意味 〔方向〕のさまざまな類比関係 を明示しようとしているということではない。そこに開かれている問題---そして一つの一般史の仕事を明確化する問題---は、次の諸点を決定することにある。すなわち、これらの相異なった系 の間で、いかなる連関の形態が正当に記述されうるか?それらの系 は、いかなる垂直的なシステムを編制しうるか?それらの系相互の間の相関関係と支配の働きは、いかなるものか?なにゆえにさまざまなずれ 〔転移〕や、相異なった時間性、さまざまな残存 がありうるのか?いかなる明確な総体 〔集合〕のうちに、いくつかの要素は、同時的に姿を現わしうるのか?要するに、ただ単にいかなる系 ではなく、いかなる「系 の系 」を、換言すれば、いかなる「図表 」を構成しうるか、ということである。包括的記述 は、あらゆる現象を、唯一の中心---原理、意味作用 、精神、世界像、総体的形態といったもの---のまわりにまとめ上げていく。が、一般史の方は、逆に、分散の空間を展開していくであろう。* どんなにのんびりした人たちに対しても、「
(同上、20ページ)図表 」が(おそらくそのいかなる意味においても)、はっきり「系 の系 」であることを指摘する必要があろうか?ともあれ、「タブロー」とは、子供たちを---年頃からいって、かれらはたしかに、映画の激しい動きの方を好むが---およそこの上なく失望させるような、ランプのまえの固定したちっぽけな映像 ではない。
tableauを単に「図表」と訳すのは適切ではないかもしれない。後の原註の後半の意と整合しないからである。むしろ後半は「眺望」という訳語がもっとも原意に近いだろう。新たな眺望を生み出すようなダイナミックなテキストを構成するためには、ハイパーリンクの仕組みは適しているのではないか。おそらく、それを支援するのはドキュメントを構成する要素に従って、ドキュメント全体を格納できるようなデータベースかもしれない。前半のtableauの意、「系の系」はデータベースを連想させるのである。しかし、包括的記述そのものは自ら生成しなくてはならないことは言うまでもない。
真珠は、炭酸カルシウムの硬い層とタンパク質の軟らかい層の微細な積層構造を持っていて、薄い皮を積み重ねた玉であるタマネギに例えられても、それほどおかしくないなあと、拘ってみる。実際の構造は似ても似つかないが・・・
中国新聞、2006年6月11日(日)、第9面、現論、東京大学名誉教授 養老孟司、「高松塚壁画と昆虫標本」ネタ。
養老孟司「高松塚壁画と昆虫標本」昆虫に生えたカビをどう処理するかというノウハウが書かれているが、当然それが本論ではない。人間はコンピュータや自動車は作れても、カビのような高級なもの(生命)は作れないという、いつものお話。カビの繊維は夏から冬に向けて太くなるそうで、この繊維で暖かいセーターが作れないかという話は新しい(^^;)昆虫のカビとりでカビを顕微鏡観察した経験から得られた知見なのだろう。
最近、「人間科学」(筑摩書房、2002年)を読み終えたが、何が書いてあったか、要点を忘れた(^^;)うーん、そうそう・・・人間を物質・エネルギー系だけで考えるのは片手落ちで、情報系としての人間を考える必要があるというお話。遺伝子と細胞、言葉と脳を対比させて考える。新鮮な視点だった。
さらに、2冊をコレクションに追加。吉田直哉氏との対談「目から脳に抜ける話」(ちくま文庫、2000年、原著: 筑摩書房、1994年)と森岡正博氏との対論「脳と生命」(ちくま学芸文庫、2003年、原著: ジャストシステム、1995年)。最近の6冊のうちの2冊。YORO-MANIAXの著作一覧を見ると、現在すべてで235冊になる。僕が所有している書籍は15%にも及ばない。ここまで来たらと野望を抱いたのだが、すぐ挫折しそうだ。
サロンde渕研ネタ。Rubyの盆栽的プログラミングのページのリンクが切れているので、「盆栽的プログラミング」で検索すると、渕 一博 (Fuchi,Kazuhiro)のページに到達。「サロンde渕研」を発見。
音声言語の研究もおもしろいかも。PC上でスペアナって動くのかな。論理研究のページに元の「盆栽的プログラミング」のページへのリンクがあり、「RubyでXML」へのリンクもある。一応、Yet Another Ruby Linksのリンクも更新したが、リンクを作成するだけでは意味がない。もっと具体的におもしろいことができればと思う。
日本 Ruby カンファレンス 2006 - jarp,ネタ。わたなべさんのRSSから。
日本Rubyカンファレンス2006プログラムのまつもとさんの基調講演のタイトル、「The State of Dominion」は、Larry Wall氏の「The State of the Onion」(August 19, 2004)をもじったものであることは明らかであるが、Dominionとは「統治・支配」という意味である。Onionの意味はもちろん、「タマネギ」だが、ニュアンスを見るために英辞郎を引いてみると、「 If thou hast not a capon, feed on an onion.(丸々太った鳥が手元になければ、玉ねぎを代わりに食べよ。◆「現実を受け入れ、それで満足せよ」という意味。)」のような格言が出てくる。現実の状態のような意なのかな。
Larry Wall氏のサイトを見ると「1st State of the Onion」(Perl Culture: 1997 Perl Conference)、2nd State of the Onion (1998 Perl Conference)、3rd State of the Perl Onion (1999 Perl Conference)が見つかる。ついでに、IT Conversations: Larry Wall - State of the Onion(perl.com: The State of the Onion 9 September 22, 2005)もピックアップ。
講演資料が置かれたら読んでみよう。
青空文庫の本、はる書房から「インターネット図書館 青空文庫」が出ているので、購入することにした。4843作品収録のDVD-ROM付きである。一気に蔵書が、5000冊近く増えることになる。それも電子化されたものだ。これが、1,500円である。そのような時代になったということである。サイトからダウンロードできるのでDVD-ROMが欲しいわけじゃないが、記念碑的な書籍だし、青空文庫の使い方についての本でもある。今後の参考にしたい。
青空文庫はテキスト処理の対象としても大変興味深いものである。縦読みビュアーのようなものは簡単に作れるが、もう一度元の入力テキストに戻って、タグ付けをすることによって、様々な読み方ができるようになったり、新しいアプリケーションを作れる可能性があるだろう。
テキスト処理においてはあらゆるテキストが対象となる可能性を持っているが、興味のないテキストを対象にすることはない。ある程度の形式を持つ有意味の大量のテキストを見るとわくわくとしてくる。千夜千冊もそのような電子テキストである。個人的には、本更新日記も処理の対象として重要である。次のステップではテキストをブラウジングの最中に、テキストの特定の部分にメモ付け、あるいは註付けをどのような仕掛けで行うかということを思いつく必要がある。様々な方法が考えられそうだが、さて・・・
GoogleやInternet Archiveの書籍電子化計画はページをカメラで撮影するロボットで行われているようだ。1200-3000ページ/時間とか。表音文字は文字数が少ないから、OCRでも判読は容易だろう。日本語も簡単に入力できると楽なんだが。最近のOCRソフトの進歩を試してみたいなと思ったり。
「駈込み訴え」のHTML形式の場合の説明を書きながら、やはり見ずらいよね、main_textクラスのdivタグを付加すればいいんじゃないと思いついて、ちょっと追加。バッチリ。
太宰治「駈込み訴え」aozora2tate.cgi ver. 0.2: 「青空文庫」縦読みビュアー
#!/Perl/bin/MSWin32-x86-object/jperl.exe require 'cgi-lib.pl'; &ReadParse(*in); $aozoradir = $ENV{'DOCROOT'} . "/aozora"; $cgidir = $ENV{'CGIDIR'}; if($in{'aozora'}){ $aozora = $in{'aozora'}; }else{ $aozora = $ARGV[0]; } $css = 1; open(IN, $aozoradir . "/" . $aozora); print "Content-type: text/html;\n\n"; while(<IN>){ if(/<\/head>/i){ if($css){ print "<link rel=\"stylesheet\" type=\"text/css\" href=\"/aozora/default.css\">\n"; } } # <link rel="stylesheet" type="text/css" href="141_15127_files/default.css"> if(s/(<link .+?href=")[\d_]+files\/(default.css">)/$1\/aozora\/$2/i){ $css = 0; } if(/(\d+年|\d+月|\d+日|底本|[#.+])/){ s/([^\d]*)(\d{1,4})([^\d])/$1<span class="yoko">$2<\/span>$3/gi; } #<img gaiji="gaiji" src="141_15127_files/1-86-22.png" alt="※(「木+解」、第3水準1-86-22)" class="gaiji"> s/(<img gaiji="gaiji" src=")([\d_]+files\/[\d-]+\.png".+?class="gaiji">)/$1\/aozora\/$2/gi; if(/<\/body>/i){ print "</div>\n" if $css; print "</div>\n"; } print; if(/<body.*?>/i){ print "<div class=\"tate\">\n"; print "<div class=\"main_text\">\n" if $css; } } close(IN);
前の記事から、更新日記インデックスにjperlの専用カテゴリを作った。CodeZine(プログラミングと開発者のためのCodeZine)にPerl 5.8の記事を書き始めたこともあって、今後、各種のPerlのカテゴリに分けて記事を書く必要があるだろう。いずれ、Perl 6やParrotなどのカテゴリも出てくることになるだろう。
jperlはShift_JISのテキストデータが存在するかぎり、使い続けることになるだろう。ユーザーの環境がWindowsがメインであり続けるならばそうなるかもしれない。Parrotの性能が驚異的なものになれば、jptop6なんてプロジェクトが生まれるかもしれない(^^)vあるいは、jperlそのものか、同等のものをParrot上に構築するとかv(^^)vも、僕の能力を超えるかもしれないが、考えるかもしれない。まあ、Rubyでよいのかもと思うが(^^;)
「実践実用Perl」の今後のShift_JIS用jperlサポート体制としては、ActivePerlのPPMpackagesを全部ダウンロードして保存しているので、万が一、ActivePerlのZipアーカイブサポートがなくなっても大丈夫(^^)ただ、ライブラリの更新がないのでねえ。僕が取得して使えることがわかったものは、PPMで提供できるようになればベストなのだが、これは課題として考えよう。LWPはCPANから取得した最新のものが使えるので、jperlユーザーはトライしてみるとよいだろう。まず、Perl 5.005_03で使える最新版モジュールってどれくらいあるのだろう。それも時間があったら調べてみよう。無論、古いバージョンも体系的に保管されているので、どのバージョンまでPerl 5.005_03で使えるか、READMEなどを調べてみるとよいだろう。
もっとも、jperlでテキスト処理をするのにモジュールはまず必要ない。Perl自身がテキスト処理モジュールなのだから(^^)v 必要なのは、テキスト処理以外の部分についてのモジュールであり、インターネット時代には、libwww(LWP)とlibnet(Net)モジュールは特に重要である。最新版のlibwww-perl-5.805(08 Dec 2005)は5.005_03以上で使えるように書かれている。同様にlibnet-1.19(30 Jun 2004)も5.002以上で使える。LWPはPerl 4用もあるぐらいなのだ。jperlユーザーに幸いあれ(^^)/~
ついでに、「jperlユーザーのために」というページを作った。更新日記の上のリンク欄の最初にも置くことにした。主にモジュール関係の情報を置こうと思う。
せっかく青空文庫のXHTMLファイルを縦書きに変換するスクリプトとCSSを考えたので、デスクトップCGIに仕立ててみた。対象のファイルがShift_JISなので、jperlスクリプトを使う。
青空文庫から、好きな本のXHTMLファイルのリンクを右クリックして、「名前を付けてページを保存する」。あらかじめ、HTTPサーバーのドキュメントルート、例えば「実践実用Perl」に従えば、「c:/anhttpd/htdocs」(システム環境変数 DOCROOT の値となる)に「aozora」というフォルダを作っておき、そこに保存する。前の記事([本] 全書籍電子化計画と青空文庫のXHTMLの縦書き表示 [6/10/2006 (Sat.)])のdefault.cssもそのフォルダに格納しておく。CGIスクリプトを格納するディレクトリは、システム環境変数 CGIDIR に「/cgi-bin/awakening」などを指定しておく。
aozora_list.cgi: 青空文庫から取得したファイルのリストを表示する。ファイル名には、縦読みビュアー(aozora2tate.cgi)へのリンクを作成する。縦書きモードが表示できるのは、IEしかないので、Firefoxでは拡張機能に「IE View」か「IE Tab」をインストールしておく必要がある。そうすれば、右クリックで、「このリンクをIEで開く」か「このリンクをIEに切り替えて開く」(タブに表示)を選択すればよい。
#!/Perl/bin/MSWin32-x86-object/jperl.exe $aozoradir = $ENV{'DOCROOT'} . "/aozora"; $cgidir = $ENV{'CGIDIR'}; opendir(DIR,$aozoradir); @aozorafiles = grep(/^[\d_]+\.html$/,readdir(DIR)); closedir(DIR); print "Content-type: text/html;\n\n"; print "<html><body><h3>青空文庫ファイルリスト</h3><hr /><ol>\n"; foreach $file (sort @aozorafiles){ print "<li><a href=\"$cgidir/aozora2tate.cgi?aozora=$file\">$file</a></li>\n"; } print "</ol></body></html>\n";
aozora2tate.cgi: 青空文庫縦読みビュアー
#!/Perl/bin/MSWin32-x86-object/jperl.exe require 'cgi-lib.pl'; &ReadParse(*in); $aozoradir = $ENV{'DOCROOT'} . "/aozora"; $cgidir = $ENV{'CGIDIR'}; if($in{'aozora'}){ $aozora = $in{'aozora'}; }else{ $aozora = $ARGV[0]; } $css = 1; open(IN, $aozoradir . "/" . $aozora); print "Content-type: text/html;\n\n"; while(<IN>){ if(/<\/head>/i){ if($css){ print "<link rel=\"stylesheet\" type=\"text/css\" href=\"/aozora/default.css\">\n"; } } # <link rel="stylesheet" type="text/css" href="141_15127_files/default.css"> if(s/(<link .+?href=")[\d_]+files\/(default.css">)/$1\/aozora\/$2/i){ $css = 0; } if(/(\d+年|\d+月|\d+日|底本|[#.+])/){ s/([^\d]*)(\d{1,4})([^\d])/$1<span class="yoko">$2<\/span>$3/gi; } #<img gaiji="gaiji" src="141_15127_files/1-86-22.png" alt="※(「木+解」、第3水準1-86-22)" class="gaiji"> s/(<img gaiji="gaiji" src=")([\d_]+files\/[\d-]+\.png".+?class="gaiji">)/$1\/aozora\/$2/gi; if(/<\/body>/i){ print "</div>\n"; } print; if(/<body.*?>/i){ print "<div class=\"tate\">\n"; } } close(IN);宮沢賢治「グスコーブドリの伝記」
「駈込み訴え」はHTMLファイルの提供となっており、divタグでclassを定義して、CSSを使うように書かれていないので、aozora2tate.cgiによる出力は、head終了タグの前にスタイルシートへのlinkタグを付加し、tateクラスを持つdivタグでbodyの内容全体を挟んで、縦書きモードを付加しただけになっている。XHTMLはPerlスクリプトで変換して自動生成しているそうなので、一定のタグ付けがなされているから、aozora2tate.cgiの効果は一定となるはずだ。
青空文庫のリソースも素晴らしいものになりつつある。以前縦書きで表示させてみようと思い立ったことがあるのだが、途中で挫折していた。青空文庫のxhtmlのリンクを右クリックして「名前を付けてページを保存する」と外字の画像ファイルやCSSも一緒に保存される。青空文庫のxhtmlファイルはShift_JISなので、次のPerlスクリプト(もちろんjperl^^)vで処理し、CSSを縦書き表示用のものに変更する。
aozora2tate.pl
while(<>){ if(/<\/body>/){ print "</div>\n"; } if(/(\d+年|\d+月|\d+日|底本|[#.+])/){ s/([^\d]*)(\d{1,4})([^\d])/$1<span class="yoko">$2<\/span>$3/g; } print; if(/<body>/){ print "<div class=\"tate\">\n"; } }
default.css (縦書き用)
body { direction: ltr; font-family: "MS 明朝", serif; overflow: auto; } div.tate { writing-mode: tb-rl; } span.yoko { writing-mode: lr-tb; } h1 { margin-top: 2em; line-height: 2em} h2 { text-align: right; } div.main_text { line-height: 2em; height: 40em; } div.bibliographical_information, div.notation_notes { line-height: 2em; height: 40em; } span.notes { display: none; }
表示結果は次のようになる。
芥川龍之介「西方の人」の最初の部分縦ルビ > 青空文庫を縦書きで読むの記事と佐藤和人著、「HTML/JavaScript/CSS ホームページ裏ワザ大事典」、インプレス、2002年10月11日初版第1刷、534ページ、2400円 の「TIPS 073」を参照した。
日記に記録していない本が増殖しつつある。今日もジャスコのフタバ図書で2冊買った。6冊になった。吉本隆明著、「読書の方法 - なにを、どう読むか」、知恵の森文庫 よ 4-1、光文社、2006年5月15日初版第1刷(原著: 光文社、2001年11月)、421ページ、743円 を読んでいると、太宰治の「駈込み訴へ」と芥川の「西方の人」が比較されている。太宰や芥川なら、青空文庫にあるなあと調べ始めると、そらもようの「2006年01月01日 全書籍電子化計画と著作権保護期間の行方」の記事が気になる。Internet ArchiveのOpen libraryなどへのリンクを見て回る。既に取り上げた話だが・・・
Microsoft、Windows Vistaベータ2の一般向け無料提供を開始 (MYCOMジャーナル)ネタ。
DVD-Rを買ってきて、3.5GBをダウンロードしようかとも思ったが、混み合っているという赤字のアナウンスが出ているし、ダウンロード時間の表示を見て、うーむどうするかと唸って、DVDを発送料込みで1,980円を選択した。記事には発送無料と書いてあったので、話が違うが、まあ仕方がない。ダウンロードしてもその程度のコストは掛かる。2007年6月1日で使用期限が切れる。
実はその前に、IE 7をアンインストールした。Firefoxからは注文画面表示が乱れてデータが入力できないし、IE 7では注文サイトにアクセスしようとすると落ちてしまうからだ。IE 7のアンインストールはこれで2回目だ。インテリジェントなインストーラで元のIE 6に自動的に戻る。
Pugs: Possible $job talk at OSCON.ネタ。Audrey Tang氏の「Programming the Kernel for Web 2.0」のトークがアナウンスされている。
世の中はWeb 2.0なんだが、僕は、Desktop 2.0だ、なんて天邪鬼なことを言う。Webは汲み尽くせない大海であり広大だが、パーソナルな観点から見ると、逆説的には世界のほんの一部に過ぎない。Desktopを単なるWebへの入り口と見ては貧弱なコンピューティング世界を想定することになる。Desktopはコンピュータ・ユーザーの世界観を表現する場である。Webは外界であり、ホームページは外界に浮かべた燈台のようなものだ。外界とのコミュニケータである。Webブラウザは身体のインターネットへの拡張であり、感覚器官であり、かつ行動-表現ツールだ。デスクトップサーバーとデスクトップCGIが頭脳として基盤を支える。これをDesktop 2.0と名付けよう。
Web 2.0においては、ユーザーの状態、論理プロセス、そしてサーバー資源をインテリジェントに取り扱う枠組みが求められている。Desktop 2.0においては、他のユーザーのことは考える必要はないので、自ら達成したいことに集中できる。デスクトップ資源をインテリジェントに取り扱い、Webの情報や自らの思索とリンクさせ、新たな思索や情報を生み出すプロセスの枠組みを考える。
Desktop 2.0はデスクトップの資源すべてを活用することができる。ある意味で、Desktop 2.0とはコンピューティングそのものである。コンピューティング環境で以前と違うのは、プログラミング環境が大変充実してきたことである。最近では、Visual C++でさえもフリー版が出ているし、Javaも豊富なAPIを備えるようになった。生産性の高いスクリプト言語、Perl、PHP、Python、Ruby、Tcl/Tkなどが高性能なコンピュータで本格的に使えるようになったために、ここ2、3年、C++/Javaが押されている構図が見え隠れする。実際のところ、コンピュータ・ユーザーがデスクトップ資源を有効に活用するためには、各種資源を結び付けて表現することが容易なスクリプト言語を使用したデスクトップCGIの枠組みが重要だと思う。
昨日に引き続き、Atomフォーマットの詳細な分析を続ける。OpenOffice.orgのCalcに、Google SpreadSheetsから昨晩ダウンロードしておいたCSVテキストを読み込ませた。
順序としては、Atomの記事を書くより先にやるべきことだが、Perlを使えば、概要の把握だけで、手軽に実用的な抽出スクリプトは書ける。しかし、見落としがあった。category要素は開始タグと終了タグで挟むタイプではなく、term属性でカテゴリ名を保持している。仕様書のサンプルにもcategory要素はないし、実際のGoogle関連等のAtomフィードにもcategory要素はないようだ。更新日記Atom配信スクリプト(rn2atom.cgi)とAtom解析・HTML表示スクリプト(atom2html.cgi)は簡単にアップデートできたが、Atomの要素表を作るのは二日掛りだ。なんとか完成したね。複雑過ぎるかな。まあこんなもんさ。現実は複雑なのだ。
今日は次第に天候が回復して、垂れ込めていた低い雲が上昇し続け、昼には宮島も全体の姿を見せた。帰宅時には青空に夏の雲が広がっている。そう6月は夏だよ。新緑の色彩の鮮やかな季節だ。日付が替わってしまった深夜に思いを廻らす。
車で雨の中を霧に包まれた街へ帰ってくる。夕食後、Google Spreadsheetsを試す。
Atomフォーマットの仕様を表にまとめてみる。feed、entryとcontentがコンテナ要素、そのほかはメタデータ要素だが、Text constructs、Person constructsとDate constructsという分類もある。属性もあるし、条件によって属性が変化する。この程度のものでも複雑だよなと、一応入力を終えて、セーブする。Excel形式だと、セルデータに空白があると区切られた最後のデータしか取り込まれない。結局、CSVでセーブする。Webにもセーブしておく。Excel形式でセーブするためには、OpenOfficeが起動されるのだが、それでは意味がないだろうと思う。最初から、Calcを使えばいいじゃない。疲れた。
次回は少しセキュリティの話を入れよう。齊木さんからの連絡では、閲覧数の伸びは順調なそうで、少し安心。
Zazelさんの御蔭で、デスクトップCGIの位置づけが明確になった。デスクトップCGIを動作させるローカルHTTPサーバーは、そのサーバーが動作するローカルマシン(と自分が管理し、かつデスクトップCGIにアクセスすることを必要とするマシン)のみからしかアクセスできない設定とする。こう宣言しておけば、単なるCGIと明確に区別できるので、XSS脆弱性等のセキュリティ関連の呪縛から逃れることができる。当初から、頭の片隅には懸念としてはあったのだが、アクションに結び付いていなかった。もやもやが晴れた。
松岡正剛の千夜千冊・遊蕩篇 『海をわたる蝶』日浦勇ネタ。6/6に再開。セキュリティ問題で、見るのを忘れていた(^^;)
放埓篇全7巻+特別巻のセット本体定価が95,000円になってしまった。10月刊行。
書籍のデジタル化は、知識を人類共有の財産とするためには必要なことだろう。しかし、強引なやり方は反発を招くだけかもしれない。著作権の問題のないところから徐々に進めて、まず価値のあることだと証明すればよいだろう。みんなが納得してからでも遅くない。
今日アクセスしてみると、Google Spreadsheetsはまだ準備中だった。あたりさわりのないデータをまとめたりするのには使わせてもらおうと思う。しかし、入力データはスキャンされて何かの参考にされるのだろうか(^^;)
デスクトップにはOpenOffice.orgが既にあるが、軽くブラウザ上で動く作表ソフトがあると大変便利だろう。
デスクトップCGIでは、LANに接続していれば他のマシンからローカルサーバーにアクセスされる危険性があるわけで、それを避けるためには、サーバーへのアクセスをlocalhostだけに許可する設定にすればよいだろうと思う。取り敢えず、CodeZineの記事と本日記のApacheを使う記事を書き直した。
Anhttpdでは、[オプション一般]→[アクセス制御]→[許可IP]の"*.*.*.*"を"127.0.0.1"に書き直せばよい。実践実用Perlサポートでもアナウンスしておこう。
ソニーのポータブルMDレコーダー、Hi-MD MZ-RH1がようやく昨日届いた。
Hi-MD Walkman MZ-RH1ソニーは宣伝があまりうまいとは言えない。この製品は重要だし、もっと前面に打ち出すべきだと思う。なぜなら、iPodにはない録音機能を持っているからである。また、MP3/128kbps(MPEG-1 Audio Layer-3/44.1kHz/固定ビットレート)も再生できることをもっとアピールすべきだ。取り敢えず使える。ATRACは録音で活かす。アナログのレコードのライン録音にも使えるし、マイク録音にも期待している。Hi-MD規格の1GBディスクで、ATRAC3plus/48kbpsを使えば、45時間の長時間録音が可能なのだ。しかも電池込みで106gと軽量、ワイシャツなどの胸ポケットにちょうど入れて置けるサイズになっている。再生音を聞くとどこからこれだけの素晴らしい音が再生できるのだろうと驚愕する。イヤホンは耳に付けた感じがソフトで高級感がある。落ち着いた聴きやすい音になっている。柔らかい低音が感じられ、安っぽい刺激的な音が出ない。これなら長時間聞いても耳を傷めることはないのではと思わせる。
SonicStageでHi-MDにMP3ファイルを転送するそして、Hi-MDはUSB2.0でPCにつながる。SonicStageで自動認識して、PCから音楽を転送できるし、逆もできる。Explorerから1GBの外部記憶装置として取り扱うことも可能である。現在、1GBのフラッシュメモリは1万円弱程度の価格だが、Hi-MD(1GB)はなんとフォーマット済みのブランクディスク3枚が、1,880円で購入できた。1枚630円弱、メディアのコストパフォーマンスは圧倒的に有利である。本体価格は、ブランクディスクを買うついでにコジマ電機で調べると、39,800円から10%引きぐらいの感じだ。今回は、楽天のい〜でじ!!で33,967円(税・送料込み)で購入。最初、5月下旬の入荷の連絡があったが、下旬になってもなしのつぶて、クレームメールを入れて、なんとか5/31の出荷になった。4/23の注文なので、一月以上待たされた。現在も在庫なしの表示が出ている。Amazonで調べてみると、安く購入しようと思えば、入荷待ちになるようだ。人気商品になっているみたい。良いものは放っておいても売れるか(^^;)
プログラミングと開発者のためのCodeZine:デスクトップCGIでWebとデスクトップを融合する 第1回(Perl, CGI, デスクトップ)ネタ。
翔泳社の「開発者のための実装系Webマガジン」と銘打ったCodeZineというサイトに「デスクトップCGIでWebとデスクトップを融合する」というタイトルで記事を書くことになった。実は翔泳社とは縁が有り、「PC-PAGE30 フリーソフトウェア派宣言Ver.2」(1992)のショート・ショートに、「夢見るテキストデータ」という短文を載せてもらっている。そのちょっと前に、「PC-PAGE21 フリーソフトウェア派宣言」で、 Perlに出会った。正確にはjperlであるが。このPC-PAGEシリーズの25が、かの有名な「MS-DOSテキストデータ料理学 sed,awkのあるUNIX流パソコン環境」であり、Part 1が「テキストファイル主義のすすめ」であった。日本では、この本とアスキーの「AWKを256倍使うための本」(1993)が、スクリプト言語によるテキスト処理の概念を定着させたといってもよい。ほぼ同時にソフトバンクからLarry WallとR.L.Schwaltzの「Perlプログラミング」(1993)が出て、jperlをテキスト処理に本格的に使うようになったのである。
当時は、NIFTY SERVEのパソコン通信やFGALなどのフォーラムの全盛時代であり、テキスト処理の対象はもっぱら、AirCraftなどの通信ソフトが出力するログであった。いまや、インターネットの出現によって、テキスト処理の対象はHTMLなどの構造化テキストファイルである。テキストファイルは通信ログのような単なるテキストだけの入れ物ではなくなり、世界のあらゆる要素を詰め込むことができる万能のテキストになりつつある。ハイパーリンクによってテキストとテキストは結び合わされ、文書間の複雑なネットワーク表現が可能となった。これによって、スクリプト言語は、あらゆるものを関連付ける糊(glue)言語として飛躍的に価値を高めたのである。
記事の中味はCodeZineのサイトを見ていただくとして、次なる展開は、本日記で展開している思索を形にしていくことである。着陸地点が定かでないままに始めてしまったが、できるだけ遠くに飛びたいと思う。すぐ失速してしまうかもしれないが(^^;)
小説を書くことが世界のモデルを作ることであるならば、日記を書くことは世界の細部を記述することとも言えるだろう。実世界と日記世界の間をつなぐのは人間の脳ということになる。
伊藤整著、「小説の方法」、新潮文庫 1069、新潮社、昭和43(1968)年6月30日11刷(昭和32(1957)年11月10日1刷;初版: 1948年12月10日、河出書房)、246ページ、110円 を繰りながら、筒井康隆の「文学部唯野教授のサブテキスト」(1990)だけがなぜあるのかとつぶやく。丸谷才一著、「文章読本」(1977)、菅野昭正著、「小説の現在」(1974)などを本棚の奥から引っ張り出す。やれやれ、本棚の奥の混沌は増す一方だ。こちらのエントロピーを下げれば、あちらのエントロピーが増すのだ。本棚の上のほうを見やると、中村光夫著、「日本の近代小説」(1954)も眼に入ってきた。
自明のことを書き続けているようだが、日記という時系列メモは、実世界への脳の視覚言語リンクであり、記憶の拡張である。
日記をベースにして、日記を構築している要素に分解したり、再構成したりということを考えてみたいと思う。さらにはWebやデスクトップに存在するリソースを日記の構成要素として取り込む枠組みを作りたい。既に、日記を構成する要素に分解して、RSS/Atomの配信を行っている。Webリソースを取り込む仕組みとしては、Feeds(RSS/Atom)リーダーやSemanticリーダー、Webブラウザ上のRakucopyやCopy URL+を利用したクリップボード経由のタイトルとURLの取得がある。
次世代のメモるシステムでは、日記の各種の要素がデータベース化され、新しい構想の中で関連付けられたり、変形されたり、再利用されたりすることになる。デスクトップのリソースには、デジカメの写真やPC画面などの画像ファイル、テキストデータや他の文書等、各種フォーマットのファイルやプログラムやソフトウェアがある。実世界はテキストや画像、図、グラフなど、様々な形態でデジタル化され、日記に取り込まれる。そのなかから、新しい物語や書物が紡ぎだされるという大きな枠組みを求めているのだ。
夢はこれぐらいにして、現実的なところから考えてみよう。「日曜プログラマのひとりごと」の日記を構成している要素は、大きく分けて、日付、カテゴリ、タイトル、記事内容である。記事のAタグのNAME属性は、URLであると同時に、Atomフォーマットのid要素でもあることができる。日記の構成要素をmicroformatsで表現するとどうなるのか、記事内容の構成要素に既に存在しているbookやviewpointのclass属性をデータベース的にどのように取り扱うのかというようなことが課題だろう。
大江健三郎氏がサルトルに影響を受けているという文献学的証拠を求めて調査を継続。今日、danで購入した「私という小説家の作り方」(新潮文庫 お 9 21、2001;原著: 1998)にサルトルの記載、4箇所発見。澤田直氏の「新・サルトル講義」は2002年に出ているので、出典は「私という小説家の作り方」の可能性がある。「新しい文学のために」(1988)の10年後に書かれた本だ。残念ながら、サルトルについての具体的な言及はない。
手持ちのピエール・トロティニョン著、「現代フランスの哲学 -実存主義・現象学・構造主義-」、文庫クセジュ、白水社、1973年3月10日第2刷(1969年9月5日第1刷)、122ページ、350円 によれば、レヴィナスはフランスにおける現象学的潮流に位置付けられている。ハイデガーの影響や現象学における実存主義的立場を考えるとサルトルがレヴィナスを参考にしたというのは矛盾はない。
このように実体の世界でリンクを辿るのも大変おもしろい作業だ。蔵書の見直しにも新しい本の購入にもつながっていく。積読蔵書のリンク付けをして、過去の投資を回収したい(^^;)