japan.linux.com | IBMがオートノミックコンピューティングに傾注する理由
Java+Linuxでいこうということだけど、MSもなかなか大変な時代になった。Windows上でさえ、OpenOfficeを使ってみればわかることだが、かなりのレベルに達している。文書作成は日本語フォント間隔の制御が不自然でもう一息という感じ、表計算やプレゼンテーションについては十分に実用的である。自宅で使うためには既にOpenOfficeで十分だろう。自宅の新しいマシンにはOpenOfficeを次々インストールしている。個人ユーザーにとっては、大変ありがたい時代になった。良質なエディタとスクリプト言語とGIMPも合わせれば、大体のことはできてしまう。ソフトウェアそのものが有料というビジネスモデルは成り立たなくなりつつある。Webによって知的プロセスと知的サービスの価値が増大し、知的資産の価値が減少するというエスター・ダイソンの予言が的中しようとしている。いつWindows環境からLinux環境へ移るべきか。それが問題だ。
「わかる」とはどういうことか、に引用されている、山鳥重著、「脳からみた心」、NHKブックス482、1985年、239ページ、970円を購入。素晴らしい本だ。
言語は聴覚映像(記号表現)と概念(記号内容)からなるというソシュールの考えは臨床医学的にも正しいらしい。脳の障害によって、記号表現と記号内容が分離するという症状が現れるからである。人間は物事を一般化して切り出す範疇化機能を持つが、これも脳の障害によって損なわれる。名前を抽象化できなくなり、すべてが固有名詞になってしまうことがあるそうだ。これは記号表現と記号内容が密着し過ぎる現象である。意味野では視覚的なイメージや言語的イメージが喚起される。特に重要なのは言語的イメージであり、その構造は実験的に確かめられている。目的語の周囲に上位概念語・状況語・性質語、さらにその周縁に関連動詞・同一範疇語があるように、意味の網目がある。このような構造がわかったからといって、脳を組み立てたり、思考ができるわけではないが、大変興味深い。このような話は最初の30ページぐらいに出てくる。
次は文の生成の話になる。随分昔の本だが、ここまでわかっているのかという驚きに満ちている本である。最近の脳科学はそれほど進歩していないようにも思える。
たまたま、informationを英和辞書(旺文社英和中辞典、昭和50年)で引くと、類語が目を引いた。へーっなるほどと思ったので、メモメモφ(。。)
単語 | 意味 |
---|---|
information | 内容の学問的水準や獲得の方法などに関係なく、すべての「知り得たこと」 |
knowledge | 研究・観察などで得る体系だったinformation |
learning | 長期の綿密な研究で得られたknowledge |
science | 厳密に体系立った理論的なlearning |
scholarship | 専門分野で卓越したlearning |
erudition | 非常に深いlearning |
lore | 珍奇な分野についてのknowledge |
そのうち、machine scholarshipなんて言葉が出て来るに違いない(^^;)
The m17n libraryを参照。こういう多言語化された環境でパターンマッチを実現するのは簡単ではなさそうな。M-textってバイナリなのだろうね。こういうものを表現するなら、XMLが向いていそうな気がするけど。多言語文を解析するのに言語に関する知識が必要になるのは言うまでもない。多言語XML→M-text→レンダリング。ところで実用的な多言語エディタというのはあるのかな。そうか、muleだ。実際、使うのは学者か、特許関係、貿易通商関係、グローバルビジネスの現場の人かな。マルチリンガルな人はあまりいないだろうし、用途も少ない? 知らない言語は専門家にまかせちゃうか。同じプラットフォームで多言語への対応ができるという意味で大きな価値があるということだろう。
JavaServer Pages 技術による多言語 Web アプリケーションの開発。Webアプリケーションだけでなく、XSL-FO(実用化例としては、RenderXが参考になる。関係リンクは、The Extensible Stylesheet Language Family(XSL)を見ればよい。)等が一般的になれば、通常の文書にも使えるようになると思う。Unicodeベースになるわけだけど、JavaがTRONコードに対応したので、TRONコードも選択肢に入ったということかな。
The Y Window System、X Windowの承継。確かにX Windowは洗練されているとは言い難い。
PCをビデオレコーダー化する製品が出てきた。DVD+R/RW, DVD-R/RW ATAPI接続 DriveBay 用 NEC 8倍速ライト/ TVチューナー搭載ビデオキャプチャーボードセット。工作を楽しめないかもしれないが、このほうが楽かもしれない。値段も安い。しかし、プログラミングを楽しむなら、OpenPVSかな。
Natureネタ、VOL 427、15 JANUARY 2004。原文はhttp://www.doc.ic.ac.uk/~shm/Papers/Oliver_Jan15_hi.pdfで読めたりする。著者の一人Stephen H. Muggletonのサイトにある。
Robot ScientistsはPrologをTclにコンパイルして動かす。Robot Scientistsはロボットに関する科学者という意味ではなくて、ロボットが科学するわけだ。計算モデルはKEGGが元になっている。このKEGG: Kyoto Encyclopedia of Genes and Genomesというのが凄い。 KEGG metabolic pathways map00010のようなデータを見るとわかる。ここにもXMLが動いている。KGML (KEGG Markup Language)。相当優秀な計算科学者がいるね。そこには、biorubyがあったりする。
やれやれ、XMLを使った特許なんて・・・調べてみる。この程度のことを別にXMLで書く必要もないけど、何でもXMLを使ってみようという発想はおもしろい。しかし、ちょっとしたアイデアが特許になってしまうのは素人プログラマにも脅威かもしれない。個人で使う分は問題ないのだろうが、ビジネスに結び付けようとすると制約されてしまう。スクリプトに関する特許をウォッチすべき時代になったか。
United States Patent 6,687,897 Guinart February 3, 2004
6243862 B1 * | Jun., 2001 | Lebow |
6311320 B1 * | Oct., 2001 | Jibbe |
6337696 B1 * | Jan., 2002 | Lindhorst et al. |
6453329 B1 * | Sep., 2002 | Dodgen |
6470349 B1 * | Oct., 2002 | Heninger et al. |
6473893 B1 * | Oct., 2002 | Kay et al. |
TIFFイメージの明細書を見ると、* cited by examinerとある。最近の審査官はプログラミングの知識も重要になるわけだが、勉強も大変だろう。専門家の養成も必要なんだろうね。Other ReferencesのリストにあるTelというのは、Tclの間違いだ。
山鳥重著、「わかる」とはどういうことか-認識の脳科学、ちくま新書339、2002年、236ページ、720円。
記憶には、出来事の記憶、意味の記憶、手順の記憶がある。出来事が繰り返されると重なる類似の部分が意味の記憶を形成する。それが手順であれば、繰り返されると意識に上らなくなるように記憶される。「わかる」ということの意味を追求した大変興味深い本だ。著者は、記憶障害、失語症、認知障害の専門家。
さて、どれくらいで作れるか。9万円ぐらいで販売されるらしいが、自分のLinuxマシンに作りこむことも可能だろう。ビデオキャプチャとDVD記録型ドライブで激安なら合わせて2万円強の出費で済むかも。
Projects - MythBayesでは、ベイズフィルタリング技術を使って、好みの番組を自動的に選択する仕組みも開発している。ここまで書くと、SoftwareDesign 2月号ネタであることがばれてしまう。3月号はもっと詳しい記事が出るらしい。このページのリファレンスには、ポールグラハムのページへのリンクがある。
長らくサボっていたRubyとPythonのWarmlinksを更新した。スクリプトも変更して、接続できないサイトのエラーも表示できるようにした。
10 Emerging Technologies That Will Change Your Worldという記事がMIT企業のTechnology Review誌の2月号に出ている。その中の一つにBayesian Machine Learningがある。機械学習にベイジアンネットワークを使う話だ。ベイジアンネットワークに関しては、昨年11月13日にBN2003が京都で開催され、予稿集が無料配布されたので、個人で申し込んでいただいた。大変ありがたいことである。個人でも関心さえあれば、貴重な情報に接することができるようになった。これこそ、Webの最高の活用法ではないだろうか。WebにはWebサービスのようなビジネス上重要な要素もあるわけだが、それは一部に過ぎない。
もう少し時間ができたら、MITの人工知能の教材やBN2003の予稿集などを使わせていただいて、じっくり勉強してみたいものである。一昨年から、自己組織化の勉強を少ししたけど、カテゴライゼーションなど実用実践的なプログラミングにおける応用には至らなかった。「言語と計算-4 確率的言語モデル」(北研二著、東京大学出版会、1999年)の書籍などもだいぶ以前に購入して、準備は進めているのだが・・・機械学習はそろそろ実用的な段階に差し掛かっていると思われる。スクリプティングの対象としても現実的になるのかもしれない。問題は、確率的なモデルには曖昧性が付き纏うことだ。なんだかわからないけど、現実と合う、予測に利用できるというだけでは、おもしろくないという気がする。神様はさいころを振らないというアインシュタインの言葉が頭の中をぐるぐる回っている。応用の仕方が問題なのだろう。
Kollerは、新しい構造モデリング言語、Object-oriented Bayesian Networksを提案して、成果を上げているということで選ばれている。スタンフォード大学の准教授で、既に卒業生はGoogleなどで応用を開始しており、ベイジアンネットワークをオブジェクトと属性、それらの相互関係を表すグラフとして示すことが可能なビジュアルモデルに独自に拡張しているそうだ。「大量の異なる断片を統合する能力において、人間には限界があるが、コンピュータには限界はない」とはKollerの弁である。確かに100件ぐらいのデータはなんとか読もうと思うが、1000件となるとうーむと唸ってしまう。データを統合する以前に入力が利かなかったりして(^^;)
Other Leaders in Bayesian Machine Learningのリストを載せておく。
以前MITが教育素材自体をオープンなものにするという話を読んだことがあった。その具体的な形が、OpenCourseWareである。世界の人々への贈り物である。このようにオープンで世界に貢献するプロジェクトを運営できるような仕組みを作り上げることができるのは大変素晴らしい。500ものコースがある。
人工知能のコースを見てみると、Schemeを読み書きする知識が必須となっている。Schemeを学べるコースもある。
double crownさんからメールをいただいた。Awakening Projectのコンセプトがさらに発展することを期待している。Webが発展するためには個人個人のオリジナルな発想が大切だ。
新居の冬は初めてだが、内陸高所の毘沙門台よりはだいぶ暖かいようだ。エアコン暖房もほとんどいらない。灯油はまったく買わない。暖冬の影響もあるだろうが。
日経バイト2月号の特集のタイトル。1985年9月以来のAI特集。まとめとしてはちょっと不満な感じだ。もっと中身を掘り下げて欲しい。プログラミングとかね。でも意欲は買いたい。昔は、PD-Prolog等を5inchFDで配布していた。もう19年経つのか。