关于我

我是一名拥有9年经验的AI应用开发专家,深耕RAG与Agent领域,致力于打造前沿AI解决方案,并通过技术写作推动知识传播。

工作经历

Acao (HK) Limited

AI Engineer

2025.6-2025.8

企业文档智能定制化 RAG 方案

  • 主导设计并交付了一套定制化 RAG 系统,实现对客户复杂 PDF 文档的自动问答,将人工查阅时间减少 90%。
  • 牵头客户需求研讨会,设计并实现了基于 PaddleOCR 的解析流程、LLM 驱动的知识库,以及 ColBERT 与 Elasticsearch 混合检索器,极大提升了问答准确率。
  • 设计并实施了具备开源模型降级策略的成本优化部署方案,在保证 99% 以上系统可用性的同时,有效降低运营成本。

面向教育的多语言语音至 3D 模型系统

  • 开发端到端系统,支持粤语、普通话和英语语音输入并直接生成可 3D 打印的模型,推动了教育产品的创新。
  • 构建了模块化处理流水线,集成语音识别(Baidu API)、语义理解(Qwen LLM)和 3D 资源生成(Meshy API),实现无缝的工作流自动化。
  • 通过提供直观的语音驱动创作工具,增强了学习互动性,显著提升了学生的参与度和知识的实践应用能力。

深圳中软国际科技服务有限公司

NLP开发工程师

2018.4-2024.4

华为财经AI平台核心开发

  • 负责智能金融问答系统,主导模型从Word2Vec升级至BERT,结合混合排序算法,将问答准确率提升至95%+,重复提问率下降30%,服务8000+日活用户。
  • 构建金融知识图谱,应用NER模型解决实体边界模糊问题,基于Neo4j构建包含15万实体、50万关系的图谱,通过增量更新机制提升查询效率60%。
  • 开发Text-to-SQL系统,针对复杂查询优化,SQL生成准确率达92%,显著提升财务部门数据查询效率。
  • 实现多模态文档问答系统,集成PaddleOCR与向量数据库检索,问答准确率超90%,月均处理万级文档。

华为通用AI平台算法研发

  • 基于LoRA技术对LLaMA、ChatGLM等模型进行金融领域微调,提升模型在专业任务上的性能与训练效率。
  • 构建大模型内容安全系统,实现有害内容检测(准确率96%)与幻觉检测(准确率85%),日均处理数万条内容。
  • 设计图像数据漂移检测方案,结合KL散度与VAE模型,引入主动学习,标注效率提升40%,检测准确率94%。

北京汇保海泰网络科技有限公司

开发工程师

2016.12-2018.3

保险领域智能问答系统(Simba)与数据平台建设

  • 主导开发基于Word2Vec、余弦相似度匹配与关键词规则的意图识别模块,并构建专属知识库。系统测试准确率超85%,显著提升客服效率。
  • 主导完成MySQL至PostgreSQL的迁移,通过优化索引与表结构,显著降低查询延迟,提升系统稳定性和并发性能。
  • 基于Python与Kettle构建端到端自动化ETL流程,实现数据全链路自动化处理,大幅降低人工成本并保证数据一致性。

技能专长

AI/ML

  • LLM / RAG / Fine-tuning
  • NLP (NER, Text-to-SQL, Q&A)
  • Knowledge Graph
  • Computer Vision

技术栈

  • Python / FastAPI / Flask
  • PostgreSQL / Neo4j / Elasticsearch
  • PaddleOCR / Vector DB
  • Docker / Cloud Deployment