-官方认证诚信至上 | 工业机器人及工控系统领军企业
小智 AI 聊天机器人 (XiaoZhi AI Chatbot)
发布时间:
2025-05-30 18:31:03
来源:
浏览量:391
【导语(yǔ)】小(xiǎo)智(zhì)AI聊(liáo)天(tiān)机(jī)器(qì)人(rén),作(zuò)为(wèi)一(yī)款(kuǎn)基(jī)于(yú)开(kāi)源(yuán)硬(yìng)件(jiàn)的(de)智(zhì)能(néng)对(duì)话(huà)设(shè)备(bèi),由(yóu)开(kāi)发(fā)者(zhě)“虾(xiā)哥(gē)”以(yǐ)MIT许(xǔ)可(kě)证(zhèng)发(fā)布(bù),旨(zhǐ)在(zài)降(jiàng)低(dī)AI硬(yìng)件(jiàn)开发的入门门槛。这款设备不仅具备低成本、高可玩性的特点,还支持多模态交互方式,包括语音唤醒、多语言识别及声纹识别等核心功能。无论是作为技术实验平台,还是日常智能伴侣,小智都展现出极大的潜力和应用价值。本文将详细介绍小智AI聊天机器人的核心特点、使用信息、技术原理及私有化部署方案,帮助读者更好地了解和上手这款智能设备。
小智 AI 聊天机器人是一款基于开源硬件的智能对话设备,由开发者“虾哥”以 MIT 许可证发布,旨在帮助用户入门 AI 硬件开发,将大语言模型(LLM)应用于实体设备中。
小智 AI 聊天机器人以 低成本、高可玩性 降低了 AI 硬件的入门门槛,既可作为技术实验平台,也能成为日常智能伴侣。其模块化设计允许用户持续扩展功能(如 3D 打印外壳定制),是探索 AI 落地的理想载体。
以下是其核心特点及使用信息:
核心功能与技术亮点
- 多模态交互方式
- 语音唤醒:支持离线唤醒(ESP-SR 技术)和按键唤醒(BOOT 键点击/长按),可实时打断对话。
- 多语言识别:覆盖国语、粤语、英语、日语、韩语 5 种语言。
- 声纹识别:通过声音特征区分用户身份,提供个性化对话体验。
- 智能对话引擎
- 大模型支持:可灵活接入阿里通义千问(Qwen)、深度求索(DeepSeek)、豆包(Doubao)、OpenAI 等主流 LLM。
- 短期记忆:每轮对话后自动总结内容,保持上下文连贯性。
- 角色自定义:用户可配置提示词、音色及性格,打造专属 AI 伴侣(如学者、朋友等角色) 。
- 硬件与显示扩展
- 兼容多种开发板:包括乐鑫 ESP32-S3、立创·实战派 ESP32-S3、M5Stack CoreS3 等 。
- 实时信息展示:通过 OLED/LCD 屏显示对话内容、信号强度及 Emoji 表情。
- 双网络接入:支持 Wi-Fi 和 4G(ML307 Cat.1 模块),确保户外使用稳定性
视频介绍
[](https://github.com/78/xiaozhi-esp32#%E8%A7%86%E9%A2%91%E4%BB%8B%E7%BB%8D)
ESP32+SenseVoice+Qwen72B 打造你的 AI 聊天伴侣!【bilibili】
给小智装上 DeepSeek 的聪明大脑【bilibili】
手工打造你的 AI 女友,新手入门教程【bilibili】
项目目的
[](https://github.com/78/xiaozhi-esp32#%E9%A1%B9%E7%9B%AE%E7%9B%AE%E7%9A%84)
本项目是由虾哥开源的一个开源项目,以 MIT 许可证发(fā)布(bù),允(yǔn)许任何人免费使用,并可以用于商业用途。
我们希望通过这个项目,能够帮助更多人入门 AI 硬件开发,了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。无论你是对 AI 感兴趣的学生,还是想要探索新技术的开发者,都可以通过这个项目获得宝贵的学习经验。
欢迎所有人参与到项目的开发和改进中来。如果你有任何想法或建议,请随时提出 Issue 或加入群聊。
学习交流 QQ 群:376893254
已实现功能
[](https://github.com/78/xiaozhi-esp32#%E5%B7%B2%E5%AE%9E%E7%8E%B0%E5%8A%9F%E8%83%BD)
- Wi-Fi / ML307 Cat.1 4G
- BOOT 键唤醒和打断,支持点击和长按两种触发方式
- 离线语音唤醒 ESP-SR
- 流式语音对话(WebSocket 或 UDP 协议)
- 支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
- 声纹识别,识别是谁在喊 AI 的名字 3D Speaker
- 大模型 TTS(火山引擎 或 CosyVoice)
- 大模型 LLM(Qwen, DeepSeek, Doubao)
- 可配置的提示词和音色(自定义角色)
- 短期记忆,每轮对话后自我总结
- OLED / LCD 显示屏,显示信号强弱或对话内容
- 支持 LCD 显示图片表情
- 支持多语言(中文、英文)
已支持的芯片平台
[](https://github.com/78/xiaozhi-esp32#-%E5%B7%B2%E6%94%AF%E6%8C%81%E7%9A%84%E8%8A%AF%E7%89%87%E5%B9%B3%E5%8F%B0)
- ESP32-S3
- ESP32-C3
- ESP32-P4
硬件部分
[](https://github.com/78/xiaozhi-esp32#%E7%A1%AC%E4%BB%B6%E9%83%A8%E5%88%86)
面包板手工制作实践
[](https://github.com/78/xiaozhi-esp32#%E9%9D%A2%E5%8C%85%E6%9D%BF%E6%89%8B%E5%B7%A5%E5%88%B6%E4%BD%9C%E5%AE%9E%E8%B7%B5)
详见飞书文档教程:
《小智 AI 聊天机器人百科全书》
面包板效果图如下:

已支持的开源硬件
[](https://github.com/78/xiaozhi-esp32#%E5%B7%B2%E6%94%AF%E6%8C%81%E7%9A%84%E5%BC%80%E6%BA%90%E7%A1%AC%E4%BB%B6)
- 立创·实战派 ESP32-S3 开发板
- 乐鑫 ESP32-S3-BOX3
- M5Stack CoreS3
- AtomS3R + Echo Base
- AtomMatrix + Echo Base
- 神奇按钮 2.4
- 微雪电子 ESP32-S3-Touch-AMOLED-1.8
- LILYGO T-Circle-S3
- 虾哥 Mini C3
- Moji 小智 AI 衍生版
- 璀璨·AI 吊坠
- 无名科技 Nologo-星智-1.54TFT
- SenseCAP Watcher












固件部分
[](https://github.com/78/xiaozhi-esp32#%E5%9B%BA%E4%BB%B6%E9%83%A8%E5%88%86)
免开发环境烧录
[](https://github.com/78/xiaozhi-esp32#%E5%85%8D%E5%BC%80%E5%8F%91%E7%8E%AF%E5%A2%83%E7%83%A7%E5%BD%95)
新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。
固件默认接入 xiaozhi.me 官方服务器,目前个人用户注册账号可以免费使用 Qwen 实时模型。
Flash 烧录固件(无 IDF 开发环境)
开发环境
[](https://github.com/78/xiaozhi-esp32#%E5%BC%80%E5%8F%91%E7%8E%AF%E5%A2%83)
- Cursor 或 VSCode
- 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
- Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
- 使用 Google C++ 代码风格,提交代码时(shí)请(qǐng)确(què)保(bǎo)符合规范
开发者文档
[](https://github.com/78/xiaozhi-esp32#%E5%BC%80%E5%8F%91%E8%80%85%E6%96%87%E6%A1%A3)
- 开发板定制指南 - 学习如何为小智创建自定义开发板适配
- 物联网控制模块 - 了解如何通过 AI 语音控制物联网设备
智能体配置
[](https://github.com/78/xiaozhi-esp32#%E6%99%BA%E8%83%BD%E4%BD%93%E9%85%8D%E7%BD%AE)
如果你已经拥有一个小智 AI 聊天机器人设备,可以登录 xiaozhi.me 控制台进行配置。
后台操作视频教程(旧版界面)
技术原理与私有化部署
[](https://github.com/78/xiaozhi-esp32#%E6%8A%80%E6%9C%AF%E5%8E%9F%E7%90%86%E4%B8%8E%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2)
一份详细的 WebSocket 通信协议文档
MCP 协议 通信协议
在个人电脑上部署服务器,可以参考另一位作者同样以 MIT 许可证开源的项目 xiaozhi-esp32-server