エピソード

  • 私立ずんだもん女学園放送部 podcast 20250404
    2025/04/03
    関連リンク
    • Dify MCP Plugin Hands-On Guide: Integrating Zapier for Effortless Agent Tool Calls - Dify Blog

    AIエージェントが外部ツールと連携するための標準規格MCPのDifyにおける活用事例を紹介。Difyではコミュニティ開発のMCP SSEプラグインとMCP Agent Strategyプラグインを利用可能。Zapier MCPを連携させることで、Gmailなど7,000以上のアプリとの連携が容易になる。設定はZapier MCPの設定画面からMCP Server Endpointをコピーし、Difyのプラグインに設定するだけ。これにより、AIエージェントがユーザーの指示に基づき、メール送信などのタスクを自動実行できるようになる。DifyはネイティブMCPサポートも開発中。

    引用元: https://dify.ai/blog/dify-mcp-plugin-hands-on-guide-integrating-zapier-for-effortless-agent-tool-calls

    • AI・LLM事業部プロダクト開発体制について

    LayerXのAI・LLM事業部におけるプロダクト開発体制を紹介。ビジネス部とプロダクト部の2部構成で、プロダクト部は開発、企画、LLM、デザインの各グループに分かれています。開発グループはAI Agent、WorkflowBuilder、Ai Workforceの各チームに分かれ、LLMツールを活用し生産性高く開発を推進。企画グループはPdMが開発チームと共同でプロダクト設計を進めます。LLMグループは顧客業務に特化したAIワークフローを構築し、WorkflowBuilderの機能追加・改善も行います。デザイングループはプロダクトとコミュニケーションのデザインを担当。チームコミュニケーション向上のため、Good & Newという取り組みも実施しています。

    引用元: https://tech.layerx.co.jp/entry/2025/04/03/154128

    • 任天堂スイッチ2、転売ヤー撃退へ「賢い解決策」導入–日本専用のハード、初代を50時間プレイ必須

    次世代Switchは転売対策として、日本専用版と多言語版の2モデル展開。日本専用版は言語設定が日本語のみ、アカウントも日本設定のみに制限し、価格を抑える。抽選販売では、初代Switchの50時間以上のプレイ実績と、1年以上のオンライン加入が条件となる。これにより、転売目的の購入を抑制し、真のファンに届けやすくする狙い。

    引用元: https://japan.cnet.com/article/35231292/

    • DeepSeekがGPUの制限を突破するのに使われたPTX。その制約が突破の原動力になった

    DeepSeekが、米国のGPU輸出規制を逆手に取り、低スペックGPU(H800)で高性能GPU(H100)並みの性能を達成した事例。通常CUDAで開発するところを、より低レベルなPTX(アセンブラ)で直接GPUを制御し、通信速度のボトルネックを解消。投資ファンドでの高速化ノウハウが活きた。制約を打破する技術力が光る。

    引用元: https://tamakino.hatenablog.com/entry/2025/04/03/080000

    • お便り投稿フォーム

    VOICEVOX:ずんだもん

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250403
    2025/04/02
    関連リンク
    • さまざまなAIエージェントを網羅したリスト「Awesome AI Agents」がGitHubにて公開

    E2B社がAIエージェントのリスト「Awesome AI Agents」をGitHubで公開。OSS/クローズドソース別に、様々なAIエージェントをカテゴリやユースケースで検索可能。Adala, Agent4Rec, AgentForge, AgentGPTなどがOSSとして、Ability AI, Adept AIなどが企業提供として掲載。AI活用を検討する上で参考になるリソースです。

    引用元: https://codezine.jp/article/detail/21266

    • 人気殺到で制限していた「ChatGPT」画像生成、全ユーザーに開放

    OpenAIのChatGPTで、GPT-4oモデルを使った画像生成機能が無料ユーザーでも利用可能になりました。以前はアクセス集中で制限がありましたが、現在は誰でも使えるようになっています。話題のジブリ風画像生成も試せます。ただし、無料版は1日の生成回数に制限があります。AI開発競争が激化する中で、OpenAIは画像生成機能の開放でユーザー獲得を狙っています。AIの進化は目覚ましく、今後は動画生成など、より高度な機能も登場するかもしれません。

    引用元: https://japan.cnet.com/article/35231247/

    • Devin的な自律型開発エージェントをAWS上に作ってみた!

    Devinのような自律型開発エージェントをAWS上に構築した事例紹介です。 主な特徴は、クラウド上で並列動作、サーバーレス構成、MCPサーバーとの統合、コスト効率化など。 OSSリポジトリの知識自動読み込み機能もあります。 AWSアカウント、GitHubアカウント、Slackワークスペースがあれば利用可能。 アーキテクチャは、APIGW+Lambda上のSlack BoltアプリがEC2インスタンスを起動し、エージェントが動作する構成。 開発にはAWS AppSync Eventsを利用。 詳細な手順はREADMEに記載。 タスク遂行能力はLLMの種類に依存する傾向があるが、今後はUXやコスト効率が重要になる可能性。 クラウド型エージェントは並列化が容易で、開発の効率化が期待できる。

    引用元: https://tmokmss.hatenablog.com/entry/self_host_autonomous_swe_agents_on_aws

    • 「熊本が大分を担いでるように見えた」ので描いたクマとゾウのイラストがそれにしか見えなくなる呪い

    熊本県と大分県の形をクマとゾウに見立てたイラストがTwitterで話題。一度見ると、そのイメージが頭から離れなくなるというユーモラスな内容。見た人からは「もうそうにしか見えない」「形が覚えやすくなった」などのコメントが寄せられている。

    引用元: https://togetter.com/li/2533229

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250402
    2025/04/01
    関連リンク
    • LLMモジュールの普通ではない使い方

    M5Stack社LLMモジュールは、安価な基板単体で音声対話AIを実現する注目の技術です。通常はCoreシリーズと組み合わせて使用しますが、本記事では、モジュール単体でLinuxシステムとして活用する方法を紹介。 モジュール内部のStackFlowシステムを直接制御し、音声入力、キーワード検出、音声認識、LLM、音声合成の各ユニットを初期化。 PythonスクリプトでJSONコマンドを送信し、ウェイクワード検出からの応答を可能にします。 Linux操作に慣れたエンジニアにとって、手軽にLLMモジュールを試せる手法です。今後は、より高性能なSoC搭載ボードで日本語対応も期待されています。

    引用元: https://zenn.dev/fairydevices/articles/8c12677feb3be7

    • Minimize generative AI hallucinations with Amazon Bedrock Automated Reasoning checks Amazon Web Services

    Amazon BedrockのAutomated Reasoning checksは、生成AIの「幻覚」(もっともらしい誤情報生成)を抑制する機能です。これは、論理的推論と数学的検証を用いて、LLM(大規模言語モデル)の出力を検証し、誤りを防ぎます。企業内のルールやガイドラインを形式的な論理構造に変換し、それに基づいてAIの応答をチェックします。 特に重要なのは、この機能が数学的な正確性に基づいて検証を行う点です。AIの応答が企業のポリシーに合致するかどうかを明確に判断できます。 Automated Reasoning checksは、Amazon Bedrock Guardrailsの一部として提供され、コンテンツフィルタリングや個人情報保護などの機能と連携可能です。 企業は、この機能を利用して、AIアプリケーションの信頼性を高め、安全に運用できます。

    引用元: https://aws.amazon.com/blogs/machine-learning/minimize-generative-ai-hallucinations-with-amazon-bedrock-automated-reasoning-checks/

    • AI利用「ガチ実態」調査、誰が何にAIを使っているのか?

    アンソロピックが400万件以上のユーザー会話を分析した調査によると、AI利用の57%が「拡張・増強型」で、人間の仕事を補完する傾向が強いです。 AIが最も利用されているのはプログラミングやテクニカルライティングなどのコンピューター関連業務で、全体の37.2%を占めます。次いでアート、デザイン、エンターテインメント関連が10.3%。 AIは職務全体ではなく、特定のタスクで活用される傾向があり、全職種の約36%で職務タスクの4分の1以上でAIが活用されています。

    引用元: https://www.sbbit.jp/article/cont1/161215

    • ちょっとお堅めの資料作成する時の挿絵、いらすとやでもいいけどいい感じのピクトグラム欲しいなぁ…と思っていたのでAIで生成できるようになって有難い

    資料作成で使えるピクトグラムをAIで生成できるようになったという話題です。これまでは既存の画像生成AIでは難しかったピクトグラム作成が可能になり、透過PNG形式で利用できます。さらに、生成した画像をSVG形式に変換できるツールも紹介されており、資料作成の効率化に繋がりそうです。

    引用元: https://togetter.com/li/2532277

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだどん技術室AI放送局 podcast 20250401
    2025/03/31
    関連リンク
    • Runway Research Introducing Runway Gen-4

    Runway Gen-4は、Runway社の次世代AIモデルで、メディア生成と世界観の一貫性を実現します。これにより、キャラクター、場所、オブジェクトをシーン間で一貫して生成可能になります。参照画像と指示に基づいて、スタイル、主題、場所などを維持した新しい画像や動画を作成でき、クリエイターは追加のトレーニングなしに、物語を自由に表現できます。

    引用元: https://runwayml.com/research/introducing-runway-gen-4

    • ASUS、NVIDIA GB10 Grace Blackwell Superchipを搭載したAIスーパーコンピュータASUS Ascent GX10を発表

    ASUSがNVIDIAの最新GB10 Grace Blackwell Superchipを搭載したAIスパコン「Ascent GX10」を発表。最大1,000 AI TOPSの処理能力と128GBメモリを搭載し、大規模AIモデルの開発を支援します。デスクトップで利用可能で、2台接続でさらに大規模なモデルも扱えます。2025年第2四半期に予約開始予定。

    引用元: https://prtimes.jp/main/html/rd/p/000001444.000017808.html

    • [備忘録] StreamlitでExcelのようなデータ編集機能を実装する

    Streamlitとst.data_editorで、ブラウザ上でExcelのようなデータ編集アプリを簡単に作成する方法を紹介。 環境構築: pip install streamlit pandasでstreamlitとpandasをインストール。 データ編集: st.data_editorでデータフレームをインタラクティブに編集可能に。行の追加・削除、列の編集可否設定、ドロップダウンリストの利用も可能。 CSV連携: CSVファイルのアップロード、編集後のデータダウンロード機能も追加可能。 データ入力フォーム、データクレンジング、小規模DB管理に役立ちます。

    引用元: https://qiita.com/Tadataka_Takahashi/items/90b1924c997b60ca2df4

    • お便り投稿フォーム

    VOICEVOX:ちび式じい

    続きを読む 一部表示
    1分未満
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250331
    2025/03/30
    関連リンク
    • Vercel AI SDK で MCP クライアントをツールとして利用する

    この記事では、Vercel AI SDKを使って、LLM(大規模言語モデル)に外部ツール連携機能を追加するMCP(Model Context Protocol)クライアントを利用する方法を解説します。MCPはLLMが外部のデータやツールを利用するための共通ルールです。Vercel AI SDKを使うと、MCPクライアントを簡単に組み込めます。Microsoftのplaywright-mcpを例に、Webブラウザ操作ツールをLLMから使えるようにする方法を紹介。SSEを使ってローカルサーバーと通信し、experimental_createMCPClientでクライアントを初期化。mcpClient.tools()でツール定義を取得し、LLMに渡します。使い終わったらmcpClient.close()で接続を閉じることが重要です。Schema Discoveryを使うと、ツール定義を自動で取得できます。

    引用元: https://azukiazusa.dev/blog/vercel-ai-sdk-mcp-client

    • MCPはゲームチェンジャーになるのか

    MCP(Model Context Protocol)は、AIが外部データやツールと安全に連携するための共通プロトコルです。従来のAIは知識が限定的で、外部システムとの連携が難しく、開発コストも高かったのですが、MCPはこれらの課題を解決します。 MCPは、AIをUSB-Cポートのように様々な外部サービスと繋ぎ、データの取得や書き込みを可能にします。Anthropic社が仕様とSDKを公開しており、開発者は自社のデータやサービスをMCPサーバー経由で公開できます。 従来のプラグイン型やフレームワーク型、RAG型のアプローチは部分的な解決に留まっていましたが、MCPはオープンなプロトコルであり、大手AI企業のサポートもあり、業界標準となる可能性があります。 MCPにより、AIは自律的に外部情報を取得し、実世界への働きかけが可能になり、生成AIの可能性を大きく広げると期待されています。

    引用元: https://zenn.dev/eucyt/articles/mcp-server-impact

    • Cline / Roo-Codeにおけるコード理解と新規・保守タスクの現状

    Cline/Roo-Codeは、Tree-sitterとLLMを使い、必要なコードだけを逐次解析するツールです。全体をインデックス化しないため、大規模リポジトリでも動きますが、得意なことと苦手なことがあります。

    得意なのは、単一ファイルや少数のファイルに対する小規模な修正や機能追加です。一方、全体的な依存関係を把握できないため、大規模なリファクタリングやデッドコードの検出は苦手です。

    Clineを効果的に使うには、ドキュメントコメントや依存関係マップを整備し、タスクを細かく分割することが重要です。また、gitログ分析ツールなどと組み合わせることで、より高度なリファクタリングも可能になります。

    新規プロジェクトや小規模なコードベースでは、Clineの強みが活かしやすいでしょう。 Clineは、CursorやWindsurfに比べ、手軽に利用でき、プロンプトを細かく制御できる点が魅力です。

    引用元: https://zenn.dev/tesla/articles/33d196d17bf3bb

    • 保育園のお迎え行ったら「機密情報入ってるので見せられないが、謎の動作をするExcel」の話をされてエスパーデバッグに突入した

    バックエンドエンジニアの筆者が、保育園で先生からExcelの不具合について相談を受けた話。シートが勝手に右にスクロールしてしまう現象に対し、画面が見れない状況で原因を特定しようと試みるも、解決には至らず。他のエンジニアからも様々な原因が寄せられたが、キーボードの故障やExcelの設定ミスなどが考えられる。最終的に、原因特定には実機確認が必要と結論。

    引用元: https://togetter.com/li/2531930

    • お便り投稿フォーム

    VOICEVOX:春日部つむぎ

    続きを読む 一部表示
    1分未満
  • 私立ずんだもん女学園放送部 podcast 20250328
    2025/03/27
    関連リンク
    • GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか

    Gemini-2.0とGPT-4oの画像生成技術は、拡散モデルから自己回帰モデルへの進化、そしてAny-to-Anyモデルという概念の登場によって実現されました。Partiは言語モデルの技術を画像生成に応用し、CM3leonはテキストと画像を双方向に扱えるようにしました。これらの研究が、テキスト、画像、音声を統合的に扱えるAny-to-Anyモデルへと繋がり、Gemini-2.0とGPT-4oが誕生しました。これらのモデルは、異なる種類のデータを統一された表現で処理し、大規模な学習によって高品質な生成を可能にしています。

    引用元: https://zenn.dev/discus0434/articles/gemini-2-0-mm

    • みんなのためのLLMアプリケーション開発環境の構築事例

    この記事は、LLMアプリケーション開発を容易にするための環境構築事例です。LLM開発では、プロンプトとコードの分離、複雑なRAG構成、デプロイの難しさが課題でした。解決策として、(1)プロンプトを共有・実行できるPrompt Storeの開発、(2)Langflowを用いたビジュアルスクリプティングの導入、(3)簡単なデプロイシステムの構築を行いました。Langflowは、GUIでLLMアプリを開発できるツールで、カスタムコンポーネントを追加することで、機能拡張も可能です。これらの取り組みにより、専門家でなくてもLLMアプリを開発・デプロイできる環境が実現し、開発サイクルが大幅に短縮されました。

    引用元: https://techblog.lycorp.co.jp/ja/20250327a

    • まさかの。Androidオープンソースプロジェクト、非公開開発に - すまほん!!

    GoogleがAndroid OSの開発を非公開化。今後は社内ブランチに一本化し、開発プロセスを効率化する狙い。一般ユーザーやアプリ開発者への影響は少ないものの、カスタムROM開発者などプラットフォームをカスタマイズする開発者には影響が出る可能性あり。OSのソースコードはリリース時に公開されるため、完全な非公開化ではない。

    引用元: https://smhn.info/202503-google-aosp

    • ChatGPTに、信じられないほど低品質で今すぐChatGPT有料プランを解約したくなるような画像を頼んだら、ユーモアあふれる画像が出てきた話「林家GPT亭名乗れる」

    ChatGPTに「低品質な画像を」と依頼したところ、予想外にユーモラスな画像が生成され話題になっています。まるで大喜利のようなセンスに、「笑点」を理解しているとの声も。

    引用元: https://togetter.com/li/2530653

    • お便り投稿フォーム

    VOICEVOX:ずんだもん

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250327
    2025/03/26
    関連リンク
    • Model context protocol (MCP) - OpenAI Agents SDK

    OpenAI Agents SDKにおけるMCP(Model Context Protocol)は、LLM(大規模言語モデル)が外部ツールやデータソースにアクセスするための標準化されたプロトコルです。MCPは、AIアプリケーションにおけるUSB-Cポートのように、LLMと様々なツールを接続する共通のインターフェースを提供します。

    MCPサーバーには、ローカルで動作するstdioサーバーと、URL経由で接続するHTTP over SSEサーバーの2種類があります。Agents SDKでは、MCPServerStdioとMCPServerSseクラスを使ってこれらのサーバーに接続できます。

    MCPサーバーをAgentに追加することで、Agentはサーバーのツールを認識し、必要に応じて呼び出すことができます。list_tools()でツール一覧を取得し、call_tool()でツールを実行します。

    ツールリストはキャッシュすることも可能です。ツールリストが変更されないことが確実な場合に、cache_tools_list=Trueを設定することで、レイテンシを改善できます。キャッシュを無効化する場合は、invalidate_tools_cache()を呼び出します。

    引用元: https://openai.github.io/openai-agents-python/mcp/

    • “「生成AIこんなものか」と諦める前に” 営業AIエージェント開発現場から学ぶLLM品質保証テクニック

    LLMの品質保証は、従来のシステム開発とは異なり、事前の網羅的なテストだけでは不十分です。重要なのは、品質を継続的にモニタリングし、改善していく運用戦略です。 具体的な戦略として、

    1. エラーパターンの言語化と継続的改善
    2. 評価と生成の分離
    3. LLMの逃げ道を作る という3つのポイントを紹介しています。 重要なのは、LLMの限界を理解した上で、課題の検知と対処の仕組みを構築することです。

    引用元: https://tech.algomatic.jp/entry/2025/03/26/182954

    • 中国DeepSeek、非推論モデルで「米国製AI」を凌駕するスコア–OpenAIやGoogleを上回る

    中国のDeepSeek V3が、AIのベンチマークでOpenAIやGoogleを上回り、非推論モデルでトップに。DeepSeek V3はオープンソースで、高速かつ低コストなのが特徴。推論モデルではないため大規模データ向けではないものの、多くのタスクで実用的な点が強みです。中国AI企業がオープンソース戦略で米国に対抗する構図が見えます。

    引用元: https://japan.cnet.com/article/35230944/

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20250326
    2025/03/25
    関連リンク
    • 財布を気にしたくないのでローカルLLM(Gemma3)にコードを書かせてみた

    この記事では、ローカルLLMのGemma3を使って、API課金を気にせずコーディングできるか検証しています。LM StudioとClineを使い、Gemma3をVSCodeから利用する環境構築手順を解説。Gemma3 4Bでは簡単なコード生成に手間取ったものの、外部サービスより高速。Gemma3 12Bは正しく動作したが低速。今後のモデル改良に期待しつつ、ローカルLLM活用を検討する価値はあると結論付けています。

    引用元: https://tech.mntsq.co.jp/entry/2025/03/25/102902

    • Microsoft Playwright MCPが切り拓くLLMとブラウザの新たな統合

    Microsoftが開発したPlaywright MCPは、LLMとブラウザを連携させる技術です。従来の画像認識と異なり、ウェブページの構造データを利用し、LLMがウェブ操作を効率的に行えます。テスト自動化、データ収集、顧客サポート、コンテンツ管理などで活用でき、テストコードの自動生成やサイト変更への自動対応を実現します。設定も比較的簡単で、今後の発展も期待されています。

    引用元: https://zenn.dev/kimkiyong/articles/679faf454b0ee0

    • Gemini 2.5: Our most intelligent AI model

    Google DeepMindが最新AIモデルGemini 2.5を発表しました。特に、Gemini 2.5 Pro Experimentalは、思考能力を持ち、複雑な問題解決に特化しています。各種ベンチマークで高い性能を示し、LMArenaのリーダーボードで首位を獲得。推論能力とコーディング能力が向上しており、Google AI StudioとGemini Advancedで利用可能です。近日中にVertex AIでも利用可能になる予定です。開発者はGoogle AI Studioで試すことができます。

    引用元: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/

    • お便り投稿フォーム

    (株式会社ずんだもんは架空の登場組織です)

    続きを読む 一部表示
    1分未満