关于我

我是一名拥有9年经验的AI应用开发专家，深耕RAG与Agent领域，致力于打造前沿AI解决方案，并通过技术写作推动知识传播。

工作经历

Acao (HK) Limited

AI Engineer

2025.6-2025.8

企业文档智能定制化 RAG 方案

主导设计并交付了一套定制化 RAG 系统，实现对客户复杂 PDF 文档的自动问答，将人工查阅时间减少 90%。
牵头客户需求研讨会，设计并实现了基于 PaddleOCR 的解析流程、LLM 驱动的知识库，以及 ColBERT 与 Elasticsearch 混合检索器，极大提升了问答准确率。
设计并实施了具备开源模型降级策略的成本优化部署方案，在保证 99% 以上系统可用性的同时，有效降低运营成本。

面向教育的多语言语音至 3D 模型系统

开发端到端系统，支持粤语、普通话和英语语音输入并直接生成可 3D 打印的模型，推动了教育产品的创新。
构建了模块化处理流水线，集成语音识别（Baidu API）、语义理解（Qwen LLM）和 3D 资源生成（Meshy API），实现无缝的工作流自动化。
通过提供直观的语音驱动创作工具，增强了学习互动性，显著提升了学生的参与度和知识的实践应用能力。

深圳中软国际科技服务有限公司

NLP开发工程师

2018.4-2024.4

华为财经AI平台核心开发

负责智能金融问答系统，主导模型从Word2Vec升级至BERT，结合混合排序算法，将问答准确率提升至95%+，重复提问率下降30%，服务8000+日活用户。
构建金融知识图谱，应用NER模型解决实体边界模糊问题，基于Neo4j构建包含15万实体、50万关系的图谱，通过增量更新机制提升查询效率60%。
开发Text-to-SQL系统，针对复杂查询优化，SQL生成准确率达92%，显著提升财务部门数据查询效率。
实现多模态文档问答系统，集成PaddleOCR与向量数据库检索，问答准确率超90%，月均处理万级文档。

华为通用AI平台算法研发

基于LoRA技术对LLaMA、ChatGLM等模型进行金融领域微调，提升模型在专业任务上的性能与训练效率。
构建大模型内容安全系统，实现有害内容检测（准确率96%）与幻觉检测（准确率85%），日均处理数万条内容。
设计图像数据漂移检测方案，结合KL散度与VAE模型，引入主动学习，标注效率提升40%，检测准确率94%。

北京汇保海泰网络科技有限公司

开发工程师

2016.12-2018.3

保险领域智能问答系统（Simba）与数据平台建设

主导开发基于Word2Vec、余弦相似度匹配与关键词规则的意图识别模块，并构建专属知识库。系统测试准确率超85%，显著提升客服效率。
主导完成MySQL至PostgreSQL的迁移，通过优化索引与表结构，显著降低查询延迟，提升系统稳定性和并发性能。
基于Python与Kettle构建端到端自动化ETL流程，实现数据全链路自动化处理，大幅降低人工成本并保证数据一致性。

技能专长

AI/ML

LLM / RAG / Fine-tuning
NLP (NER, Text-to-SQL, Q&A)
Knowledge Graph
Computer Vision

技术栈

Python / FastAPI / Flask
PostgreSQL / Neo4j / Elasticsearch
PaddleOCR / Vector DB
Docker / Cloud Deployment