XiaoZhi ESP32 AIロボットの作り方|開封から会話まで30分で完成する組立ガイド
「AIロボットを自分で作れる」と聞くと難しそうに聞こえますが、XiaoZhi ESP32キットなら、はんだ付けなし・工具不要で約30分で完成します。この記事では、開封から初めての会話までをステップバイステップで解説します。
XiaoZhi ESP32キットとは?
XiaoZhiは、中国のオープンソースコミュニティから生まれたAI会話ロボットプロジェクトです。ESP32マイコンをベースに、Wi-Fi経由でLLM(大規模言語モデル)に接続し、驚くほど自然な音声会話を実現します。
スペック概要
| 項目 | 詳細 |
|---|---|
| MCU | ESP32-S3(デュアルコア240MHz) |
| 接続 | Wi-Fi 2.4GHz |
| マイク | MEMSマイク |
| スピーカー | 3W出力 |
| ディスプレイ | 1.69インチ TFT(240×280px) |
| 電源 | USB Type-C(5V) |
| 対応LLM | ChatGPT, Claude, Gemini, Doubao等 |
| 価格 | ¥8,980(hiqoo.jpストア) |
必要なもの
キットに含まれるもの以外に用意するのはたった2つ:
- Wi-Fi環境(2.4GHz帯)
- スマートフォン(初期設定用)
パソコンは不要です。ただし、後からカスタマイズしたい場合はPCがあると便利です。
STEP 1:開封と部品の確認(5分)
箱を開けると、以下の部品が入っています:
- ESP32-S3メインボード × 1
- スピーカーモジュール × 1
- MEMSマイクモジュール × 1
- TFTディスプレイ × 1
- 外装パーツ(3Dプリント製) × 1セット
- USB Type-Cケーブル × 1
- 組み立てネジ × 必要数
- クイックスタートガイド × 1
⚠️ 部品は静電気に弱いため、金属に触れて放電してから取り扱いましょう。
STEP 2:ハードウェアの組み立て(15分)
2-1. メインボードにディスプレイを接続
FPCケーブル(フレキシブルケーブル)をメインボードのコネクタに差し込みます。ロック式コネクタなので、レバーを上げてからケーブルを挿入し、レバーを下ろしてロック。
2-2. マイクとスピーカーの接続
それぞれのモジュールを対応するコネクタに接続。向きが決まっているので、無理に押し込まないこと。正しい向きならスッと入ります。
2-3. 外装パーツへの組み込み
3Dプリント製の外装に、組み立てた基板をセット。付属のネジ(4本)で固定します。ドライバーはキットに含まれていることが多いですが、なければM2対応の精密ドライバーを用意してください。
2-4. USBケーブルで電源ON
Type-Cケーブルを接続すると、ディスプレイにXiaoZhiのロゴが表示されます。ここまでくればハードウェアは完成です🎉
STEP 3:Wi-Fiとファームウェア設定(5分)
- 電源を入れると、ディスプレイにQRコードが表示される
- スマホでQRコードを読み取り、設定ページにアクセス
- Wi-FiのSSIDとパスワードを入力
- 接続成功すると、ディスプレイに顔のアニメーションが表示される
💡 5GHz帯には非対応です。ルーターの設定で2.4GHz帯が有効になっているか確認してください。
STEP 4:LLMの接続設定(5分)
XiaoZhiの真価はここから。バックエンドのLLMを選択して接続します。
方法A:XiaoZhi公式サーバー(かんたん)
初期状態でXiaoZhi公式のAIサーバーに接続されています。すぐに日本語で会話を開始できます。まずはこれで試すのがおすすめ。
方法B:OpenAI API(ChatGPT)
- OpenAI でAPIキーを取得
- XiaoZhiの設定画面でAPIキーを入力
- モデル(GPT-4o推奨)を選択
方法C:セルフホスト(上級者向け)
自前のサーバーにOllama等でLLMをホストし、XiaoZhiから接続することも可能。完全にオフラインで動作するAIロボットが実現します。
実際に会話してみた
設定が完了したら、話しかけてみましょう。ウェイクワード(起動ワード)は**「こんにちは、シャオジー」**です。
あなた:「こんにちは、シャオジー」
XiaoZhi:「こんにちは!今日は何をして遊ぶ?」
あなた:「しりとりしよう」
XiaoZhi:「いいね!じゃあ僕から。"りんご"」
あなた:「ごりら」
XiaoZhi:「"らっこ"!次はどうぞ!」
レスポンスは約1〜2秒。Wi-Fi経由でLLMにリクエストを送り、音声合成して返答します。思ったより自然でスムーズです。
カスタマイズのヒント
声を変える
設定画面からTTS(音声合成)エンジンを変更可能。男性・女性・子ども風など、好みの声を選べます。
性格を設定する
システムプロンプトを編集して、ロボットの性格をカスタマイズ:
あなたは「ポン太」という名前の陽気なAIロボットです。
関西弁で話し、ダジャレが大好きです。
子どもの質問にはわかりやすく、楽しく答えてください。
外装を自分でデザイン
3Dプリンターがあれば、外装を自分でデザインして印刷できます。STLファイルはGitHubで公開されています。
トラブルシューティング
| 症状 | 対処法 |
|---|---|
| Wi-Fiに繋がらない | 2.4GHz帯か確認。SSIDに日本語を使っていないか確認 |
| 音声が出ない | スピーカーのコネクタが確実にロックされているか確認 |
| 応答が遅い | Wi-Fiの電波強度を確認。ルーターに近づけてテスト |
| ディスプレイが映らない | FPCケーブルのロックを再確認 |
まとめ
XiaoZhi ESP32キットは、¥8,980で「AIロボットを自分で作る」体験ができる、驚きのプロダクトです。
- はんだ付け不要、30分で完成
- ChatGPTやClaudeと接続して自然な会話
- 性格や声のカスタマイズが自由自在
- オープンソースで拡張性は無限大
子どものプログラミング教育の入口としても、大人の週末DIYプロジェクトとしても、最高の1台です。
XiaoZhi ESP32 AIロボット組立キットは hiqoo.jpストア で販売中です。
📬 組み立てで困ったことがあれば、お問い合わせからお気軽にご連絡ください。