项目
我最近的一些作品
🚀
2025.6-2025.8
企业文档智能定制化 RAG 方案
主导设计并交付了一套定制化 RAG 系统,实现对客户复杂 PDF 文档的自动问答,将人工查阅时间减少 90%。牵头客户需求研讨会,设计并实现了基于 PaddleOCR 的解析流程、LLM 驱动的知识库,以及 ColBERT 与 Elasticsearch 混合检索器,极大提升了问答准确率。设计并实施了具备开源模型降级策略的成本优化部署方案,在保证 99% 以上系统可用性的同时,有效降低运营成本。
RAG LLM PaddleOCR ColBERT Elasticsearch Python
🚀
2025.6-2025.8
面向教育的多语言语音至 3D 模型系统
开发端到端系统,支持粤语、普通话和英语语音输入并直接生成可 3D 打印的模型,推动了教育产品的创新。构建了模块化处理流水线,集成语音识别(Baidu API)、语义理解(Qwen LLM)和 3D 资源生成(Meshy API),实现无缝的工作流自动化。通过提供直观的语音驱动创作工具,增强了学习互动性,显著提升了学生的参与度和知识的实践应用能力。
Speech Recognition LLM 3D Generation Python API Integration
在线演示 (公司产品演示)
更多项目请访问我的 GitHub
访问 GitHub