「AIロボットを自分で作れる」と聞くと難しそうに聞こえますが、XiaoZhi ESP32キットなら、はんだ付けなし・工具不要で約30分で完成します。この記事では、開封から初めての会話までをステップバイステップで解説します。

XiaoZhi ESP32キットとは?

XiaoZhiは、中国のオープンソースコミュニティから生まれたAI会話ロボットプロジェクトです。ESP32マイコンをベースに、Wi-Fi経由でLLM(大規模言語モデル)に接続し、驚くほど自然な音声会話を実現します。

スペック概要

項目詳細
MCUESP32-S3(デュアルコア240MHz)
接続Wi-Fi 2.4GHz
マイクMEMSマイク
スピーカー3W出力
ディスプレイ1.69インチ TFT(240×280px)
電源USB Type-C(5V)
対応LLMChatGPT, Claude, Gemini, Doubao等
価格¥8,980(hiqoo.jpストア)

必要なもの

キットに含まれるもの以外に用意するのはたった2つ

  1. Wi-Fi環境(2.4GHz帯)
  2. スマートフォン(初期設定用)

パソコンは不要です。ただし、後からカスタマイズしたい場合はPCがあると便利です。

STEP 1:開封と部品の確認(5分)

箱を開けると、以下の部品が入っています:

  • ESP32-S3メインボード × 1
  • スピーカーモジュール × 1
  • MEMSマイクモジュール × 1
  • TFTディスプレイ × 1
  • 外装パーツ(3Dプリント製) × 1セット
  • USB Type-Cケーブル × 1
  • 組み立てネジ × 必要数
  • クイックスタートガイド × 1

⚠️ 部品は静電気に弱いため、金属に触れて放電してから取り扱いましょう。

STEP 2:ハードウェアの組み立て(15分)

2-1. メインボードにディスプレイを接続

FPCケーブル(フレキシブルケーブル)をメインボードのコネクタに差し込みます。ロック式コネクタなので、レバーを上げてからケーブルを挿入し、レバーを下ろしてロック。

2-2. マイクとスピーカーの接続

それぞれのモジュールを対応するコネクタに接続。向きが決まっているので、無理に押し込まないこと。正しい向きならスッと入ります。

2-3. 外装パーツへの組み込み

3Dプリント製の外装に、組み立てた基板をセット。付属のネジ(4本)で固定します。ドライバーはキットに含まれていることが多いですが、なければM2対応の精密ドライバーを用意してください。

2-4. USBケーブルで電源ON

Type-Cケーブルを接続すると、ディスプレイにXiaoZhiのロゴが表示されます。ここまでくればハードウェアは完成です🎉

STEP 3:Wi-Fiとファームウェア設定(5分)

  1. 電源を入れると、ディスプレイにQRコードが表示される
  2. スマホでQRコードを読み取り、設定ページにアクセス
  3. Wi-FiのSSIDとパスワードを入力
  4. 接続成功すると、ディスプレイに顔のアニメーションが表示される

💡 5GHz帯には非対応です。ルーターの設定で2.4GHz帯が有効になっているか確認してください。

STEP 4:LLMの接続設定(5分)

XiaoZhiの真価はここから。バックエンドのLLMを選択して接続します。

方法A:XiaoZhi公式サーバー(かんたん)

初期状態でXiaoZhi公式のAIサーバーに接続されています。すぐに日本語で会話を開始できます。まずはこれで試すのがおすすめ。

方法B:OpenAI API(ChatGPT)

  1. OpenAI でAPIキーを取得
  2. XiaoZhiの設定画面でAPIキーを入力
  3. モデル(GPT-4o推奨)を選択

方法C:セルフホスト(上級者向け)

自前のサーバーにOllama等でLLMをホストし、XiaoZhiから接続することも可能。完全にオフラインで動作するAIロボットが実現します。

実際に会話してみた

設定が完了したら、話しかけてみましょう。ウェイクワード(起動ワード)は**「こんにちは、シャオジー」**です。

あなた:「こんにちは、シャオジー」
XiaoZhi:「こんにちは!今日は何をして遊ぶ?」

あなた:「しりとりしよう」
XiaoZhi:「いいね!じゃあ僕から。"りんご"」

あなた:「ごりら」
XiaoZhi:「"らっこ"!次はどうぞ!」

レスポンスは約1〜2秒。Wi-Fi経由でLLMにリクエストを送り、音声合成して返答します。思ったより自然でスムーズです。

カスタマイズのヒント

声を変える

設定画面からTTS(音声合成)エンジンを変更可能。男性・女性・子ども風など、好みの声を選べます。

性格を設定する

システムプロンプトを編集して、ロボットの性格をカスタマイズ:

あなたは「ポン太」という名前の陽気なAIロボットです。
関西弁で話し、ダジャレが大好きです。
子どもの質問にはわかりやすく、楽しく答えてください。

外装を自分でデザイン

3Dプリンターがあれば、外装を自分でデザインして印刷できます。STLファイルはGitHubで公開されています。

トラブルシューティング

症状対処法
Wi-Fiに繋がらない2.4GHz帯か確認。SSIDに日本語を使っていないか確認
音声が出ないスピーカーのコネクタが確実にロックされているか確認
応答が遅いWi-Fiの電波強度を確認。ルーターに近づけてテスト
ディスプレイが映らないFPCケーブルのロックを再確認

まとめ

XiaoZhi ESP32キットは、¥8,980で「AIロボットを自分で作る」体験ができる、驚きのプロダクトです。

  • はんだ付け不要、30分で完成
  • ChatGPTやClaudeと接続して自然な会話
  • 性格や声のカスタマイズが自由自在
  • オープンソースで拡張性は無限大

子どものプログラミング教育の入口としても、大人の週末DIYプロジェクトとしても、最高の1台です。


XiaoZhi ESP32 AIロボット組立キットは hiqoo.jpストア で販売中です。

📬 組み立てで困ったことがあれば、お問い合わせからお気軽にご連絡ください。