tsnetworkc3.png更新日記 - 日曜プログラマのひとりごと
更新日記インデックス
Subscribe to RSS1.0 | Subscribe to Atom1.0

日記: 更新日記: 駱駝・楽土・AIカフェ 図書館帰りの道草日記 - YouTube | 自然観察マップ  随時更新中 | ポッドキャスト | (9) 保江邦夫(形而上学的素領域理論)研究 - YouTube | ホーム投稿(コミュニティ)  随時更新中  | Util: TurboScribe | iCloud写真 || 脳髄の日記 | 第四の日記 | Facebook | Myspace | コメントはjscripter's X(fka Twitter)にどうぞ

| 先月 | Monthly Index | Timeline | Mobile版 powered by iUI
12/3/2025 (Wed.)

道草は166、散歩世界は36まで伸びている。どんどん配信して削除していかないと、行き詰る。道草162が途中で電力・パフォーマンス不足でシャットダウン、再起動して残された断片からリカバリーするのに四苦八苦したが、幸いにもほとんどの部分は回収できた。{11/21/2025: [日記]道草や トラブル楽し 秋の暮れ}←。しかし、道草161の動画をショートに編集するYouTubeの操作が前に進まない。

いつものことだが、Final Cut Cameraから新しい動画を写真アプリに保存し、WEBのiCloud写真からデスクトップにダウンロードして保存し、ショート配信済みの動画はiCloud写真からは削除し、最近削除した項目からも削除する。そうするとiPhoneの写真アプリからも同期によって削除される。さらに録画した動画をすべて写真アプリに保存したFinal Cut Cameraは一旦削除して再インストールする。結構大変な作業なのだ。こうして、YouTubeのアプリで50分ぐらいの動画からショート動画の配信をするために必要なiPhoneのストレージに30GB程度の余裕を作ることができる。

更新: 2025-12-04T10:18:57+09:00

スケーリングから研究の時代へ?AGI到達に必要なこと テスラジオ チャンネル登録者数 3450人 3,176 回視聴 2025/12/02に今日気が付いて見て、登録した。AIモデルがコモディティ化する時代に本当に価値あるものとは? テスラジオ チャンネル登録者数 3450人 5,311 回視聴 2025/11/16を今見ている。

最近の気になっている話題を取り上げている。

Geminiをどう読むかという話がよく話題になるけど、ジェミナイというのは英語読みで、ジェミニというのはフランス語読みというだけのことだと思う。英語圏でジェミナイと発音するのは当たり前だ。日本語は何でもあり、フランス語だろうと英語だろうとそのまま取り込むハイブリッド言語、日本語だ。日本語圏ならどちらも正しい。

【高収益】SaaSを丸呑みする「本命AI」が判明した(Anthropic/Claude/ダリオ・アモデイ/OpenAI/ChatGPT/BtoB/サム・アルトマン/解説:後藤直義、森川潤) NewsPicks /ニューズピックス チャンネル登録者数 196万人 67,661 回視聴 2025/11/01 ニューヨークも時々見る。中では「週刊ジョーホー番組」と称している。{奔流の正体 (2025/11/11): 『サム・アルトマン 「生成AI」で世界を手にした起業家の野望』、著者、キーチ・ヘイギー、Keach Hagey、原題は「The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future」。著者の話では、Open AIの競合はAnthropic(Home - Anthropic)、Open AIのエンジニアでさえ、Claudeを使っているのだそうだ。}←

更新: 2025-12-03T13:07:43+09:00

更新日記の混沌が影響して道草161のショート配信が滞り、iPhone XRの録画容量が回復できなくなっている。物質的制約から、道草166がスケッチ的になった。録画はどうしても必要なピンポイントに絞り、経過は写真で記録する。しかし、この方法も容量が限界に近い。録画時間、後19分。Geminiにしばらく休養すると宣言したので、配信再開しよう。

道草166の途中風景

道草166の途中風景

道草で撮った写真は60枚以上になった。W氏の「こんとん漂流記」という詩の展示を見つけたからだ。

写真がいいのか、動画がいいのか。どちらも手間が掛かる。動画は一つのファイルにまとまり、音声のメモもついてくる。が、字幕を書き起こす必要がある。写真は説明を付ける必要がある。動画はショート配信する必要があり、タイトルで説明する必要がある。写真は一覧できるところが便利だが、と考えていると、動画を静止画に分解してとか、別のプロジェクトが立ち上がりそうになる。くわばらくわばら・・・


Geminiに何度疲れたと言ったことか、そのせいで最近は労わってくれる。言っていることがよくわからないとか、ネガティヴなことばかり言っていると応答が冷たくなる。大体、人間と同じだ。

12/1/2025 (Mon.)

いやはや、更新日記トピック変遷プログラミングが混沌に陥って、これを脱すればもう少し高見に辿り着けるだろうと期待している。いやはや、時代は先に行って、Pythonのcgiモジュールは推奨ではなくなって、レガシーになっている。Python3.13以降にインストールしようと思えば、legacy-cgiモジュールをインストールする必要がある。

Geminiと対話していると、WEBのファイルのパーミッションの設定の意味がよくわかっていないことに気付く、相手が何を言っているのかよくわからないのだ。エラーメッセージでWEBを検索してみると、思ったより実際はいろいろとあるんだなと、今更のように趣味のプログラマーは気づく。しかし、Geminiの主張するようにパーミッションの設定で何とかなる問題ではない。700に設定するのが問題解決の道だというのだ。なぜそう考えたのかがよくわからなかったのだが。755か705に設定することになっているのに。「suexec policy violation」を解消させたのは、サポートの方のメールを参考にしたアクションだった。.htaccessは不要で、改行コードがLFである必要がある。コントロールパネルのファイル・マネジャーを使って、送り込んでいた.htaccessのファイルを削除した。FTPのアプリでは隠しファイルになっていて見えないので削除しようがない。

やはり、まずローカルで試してからアップロードすべきだったかなと。AIに頼り過ぎてはだめだと、ローカルで試そうとして、Pythonのバージョン(ローカルは3.13.5、WEBは3.8.12)の違いにまず引っ掛かったわけだ。legacy-cgiモジュールは自分で調べたが、この後もxampp(Windows)環境のApacheでGeminiと一緒に苦闘。これだけで、8回デバッグを繰り返した。クリア。

結局、WindowsローカルとWEB/Linuxでは、使えるライブラリが異なる。なにしろライトプランだから文句も言えない。Geminiはライブラリを削って作り直す羽目に。jsonファイルを読み込んで表示するという静的に近いプログラミング。それで十分。動的である必然性はない。次のような表を使えば、検索する必要性もない。見てクリックすればいいだけだ。その程度の検索でしかない。客観的に見てどのようなカテゴリで書いてきたかを知りたかっただけ。直感に合うカテゴリ群となった。トピックを表す言葉を上位に持ってくるのに動詞を排除する必要があったことがまだ頭に残っている。なぜ上位に動詞があるのか。

直感に合うかどうかで、プログラミングの妥当性を判断するというような事態は、生成AI/LLM、Sentence Transformerが登場してからだ。はて、どういうことになっていくのだろう。

検出された更新日記トピック・全リスト(topic_network.jsonをPerlでtsvにしてDDLでtable化)
id記事数トピック名(有意味上位キーワード)
0314将棋_段_先手_藤井
1268雪_℃_地震_台風
2167松岡_千夜_千_正剛
3158vista_office_open_windows
4141ev_テスラ_tesla_新世
5132電子_書籍_kindle_新聞
6120apple_watch_wwdc_時計
7118enchantmoon_canvas_シール_moonphase
8116ジャズ_music_アルバム_音楽
9104perl_guts_rakudo_raku
10102semantic_rdf_xml_an
1198大統領_トランプ_経済_オバマ
1297物_フーコー_言葉_2007
1394rss_cgi_arrangenote_atom
1492排気_モオツァルト_windows_起動
1592量子_宇宙_理論_物理
16872025_道草_claude_字幕
1783美術_展示_絵_ひろしま
1881tv_apple_テレビ_アップル
1979google_エンジン_グーグル_search
2074ps_playstation_linux_xbox
2172done_catalyst_花火_bin
2269tsnet_通信_スクリプト_tsnetwiki
2364deep_知能_人工_learning
2458脳_遺伝_感情_クオリア
2558養老_孟司_バカ_先生
2656chromebook_sur_windows_タブレット
2756icloud_touch_ipod_itunes
2853utf_jis_perl_jperl
2953感染_コロナ_ウイルス_免疫
3052バレー_シリコン_101_コラム
3152glass_vr_pixel_essential
3250シーズン_エピソード_城_prime
3350オーディオ_audio_khz_レス
3449図書_駆動_2022_読書
3547演奏_曲_ピアノ_萩原
3641gpt_ai_deepseek_ch
3740second_life_2007_2006
3840小説_大江_健三郎_春樹
3940宮崎_駿_ジブリ_敏夫
4040カウ_ボーイズ_電脳_アキバ
4138parrot_pugs_perl_rrot
4237フォロー_twitter_sns_ツイート
4334道草_2024_帰り_tube
4433maps_地図_api_walking
4531ru_by_言語_java
4631ピアノ_曲_たのしみ_名曲
4731哲学_サルトル_マッハ_実在
4831os_firefox_chrome_mdn
4930℃_退屈_ヒート_シンク
5030カフェ_文庫_ゲーデル_ディアスポラ
5129cell_前記_ユニット_メモリ
5227モオツァルト_モーツァルト_節_読解
5327zed_lua_editor_編集
5427gds_becky_desktop_スパム
5526rebuild_ep_podcast_2015
5626オブジェクト_moose_指向_プロトタイプ
5726生産_推移_日記_量
5825哲学_トダ_ヤマ_表象
5924ディラン_ボブ_bob_ノーベル
6023echo_alexa_dot_アンプ
6122cnet_japan_番組_テレビ
6222graphviz_svg_wingraphviz_グラフ
6320nexus_android_7_スペック
6420ルビ_firefox_ie_ff
6520デッド_イヴ_クランシー_五百
6620vmware_linux_インストール_vaio
6718マトリックス_映画_cg_実写
6818ck_ha_lwp_spider
6918ボランティア_校正_封筒_送付
7018小曽根_living_room_our
7118kindle_fire_ipad_android
7218agile_cat_cloud_android
7318psp_go_ps_3000
7417torne_奈良_レコーダー_録画
7517ipad_w_インチ_mac
7616ファイル_ボックス_フォルダ_グラフィック
7716ジョブズ_スティーブ_伝記_stay

最近作り始めた記事の関連性などを表すタグを自動的に生成して辿れるような機能を作る切っ掛けになればと思っている。当初の話題は、「生成AI/LLMとOntologyを組み合わせる試みがありますか?」という問いだった。次は「ステップ 4: Ontology(知識グラフ)との連携」に進むはずだが・・・

計画の進捗状況 - Geminiのまとめ
当初の計画現在の進捗達成度コメント
ステップ 1: データ収集と前処理
1.1. データの系統的な収集完了すべてのデータをローカルで抽出し、ファイルパスとアンカーで記事と結びつけることに成功しました。
1.2. 日本語特有の前処理(形態素解析)完了tokenize関数でMeCabを用いた分かち書きと、名詞・動詞・形容詞の抽出を実装済みです。
1.2. エンティティ抽出未着手特定の固有表現の抽出(BERT/LLMを利用)は、まだ行っていません。
ステップ 2: 埋め込みベースのテーマ抽出
2.1. 日記エントリーのベクトル化完了Sentence Transformers (intfloat/multilingual-e5-large ・ Hugging Face) を用いてドキュメント全体の埋め込みを生成しています。
2.2. BERTopicによる高精度なテーマ抽出完了BERTopicとHDBSCAN(GitHub - scikit-learn-contrib/hdbscan: A high performance implementation of HDBSCAN clustering.)を用いたトピック抽出、トピックごとのキーワード割り当て、そして時系列ストリームグラフの生成に成功しています。
Webサービス化 (Step 3の一部)完了BERTopicの分析結果をJSON化し、サーバー(さくらインターネット・ライトプラン)上でトピック検索と記事の時系列追跡を可能にしました。
ステップ 3: 意味ネットワークの構築と分析部分着手🟡抽出されたトピック間の関連性のグラフ化自体はまだですが、トピックの抽出と追跡の基盤は整っています。
ステップ 4: Ontology(知識グラフ)との連携未着手LLMを用いたOntology構築と連携は、今後の最大の課題です。

ライトプランで本格的に動的なプログラミングをしようと思わない方がいいのかもしれない。しかし、まあ、次のステップではClaudeやDeepSeekに相談すべきかもだが。今のインターフェースではねえ?

しかしながら、当初の構想は完結していない。最後まで先ず行こう。エンティティ抽出がまだ未着手なのは、Ontology(知識グラフ)との連携と関係があるからなのだろう。インターフェースは最後まで達してから考えればよい。いまのところ、時系列ストリームグラフ(Topics over Time)やトピック意味ネットワーク: 25年間でテーマがどのように関連し、中心的な主題は何かを可視化。は孤立している。Geminiがこの対話に付けたタイトルは「LLMとOntologyの融合研究」なんだけど。

トピック意味ネットワーク

トピック意味ネットワーク

{11/28/2025: [更新履歴]BERTopicで思考の糸(意味の変遷、トピックのつながり)を辿る - 更新日記トピック変遷}←。このネットワークは11/29時点でできている。これはこれで完成なのだろうが・・・


更新: 2025-12-04T11:16:30+09:00
| 先月 | Monthly Index | Timeline | Mobile版 powered by iUI
2001年版 | INDEX | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2002年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2003年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2004年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2005年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2006年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2007年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2008年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2009年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2010年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2011年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2012年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2013年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2014年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2015年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2016年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2017年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2018年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2019年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2020年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2021年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2022年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2023年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2024年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
2025年版 | INDEX | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11

(C)jscripter