青空文庫『蜘蛛の糸』を使い、ローカルLLMとGeminiに同じ指示でセリフ抽出・感情分類CSVを作成させて比較。Gemini、Qwen3-VL、Gemma、gpt-oss、ELYZAの違いと、青空文庫前処理の重要性を検証しました。
TripoSRをRTX 4060 Ti+WSL環境に導入し、正面・側面・背面の3枚画像で3D化を検証。椅子サンプルの動作確認から、キャラ画像での粗さ、InstantSplat++との違いまでまとめました。
InstantSplat++をRTX 4060 Ti 16GB+WSL環境で検証。3枚のキャラクター画像から3D生成を試し、セットアップ手順、CUDAまわりの注意点、GPU待機ループ対策、ffmpegでの動画化、実際の生成結果までまとめました。
青空文庫のルビ・注記処理で本文が欠損する問題と、沈黙「……」が消える不具合をv3.1.2で修正。1:1行ID整合性を守る防御設計も解説。
前編で構築したローカルLLM「AI演出家」の続編。『ドグラ・マグラ』を4モデルで比較し、配役の安定性・感情タグの質・文脈設定(過去/未来行数)の最適解をまとめます。
AI開発の「仕様ドリフト」を防ぐ新プロトコル「v3.1 Unified」の実戦投入レポート。Gemini(意図)とChatGPT(観点)を統合し、開発を安定化させる「3つの記憶」とは?【運用シミュレーター・定義JSON付き】
AI駆動開発を安定運用するための「v3.1 Unified」を解説。Baseline Freeze、System Defenseでデグレを防ぎます。【Gemini等でそのまま使えるプロトコル定義(JSON)プロンプト付き】
余ったスマホをWindows操作用の左手デバイスにするアプリを1.5日で自作しました。ChatGPTを「設計担当(Reviewer)」と「実装担当(Builder)」に分けるAI駆動開発(V-Model)の手法や、Thin Client構成の技術詳細を解説します。
ChatGPTやGeminiでの開発がうまくいかない原因は「プロセスの欠如」です。文脈忘却やハルシネーションを防ぎ、要件定義から実装までを完遂するためのLLM専用プロトコル「AI Driven Development (V-Model)」を解説し、定義ファイルを配布します。
自宅PC(RTX 4060 Ti)とローカルLLM(Qwen3)を使って、小説から感情付きの台本を全自動生成する「AI演出家」システムの構築方法を解説。モデル選びの試行錯誤からPythonコードの工夫まで公開します。


コメント