教育背景

东北大学
计算机科学与技术 | 2022.09 - 至今
专业排名:10/191(TOP 5%) GPA:4.26/5.00
项目经历
RESNET实践-零件缺陷分类
2024.09-2024.10| 独立完成
项目经历
通过学习经典模型ResNet的结构,重点掌握ResNet中残差块的原理。依托PyTorch框架搭建模型,基于ImageNet数据集训练ResNet-18的预训练权重并加载到模型中。通过获取原模型全连接层的输入特征值,以开源 DeepPCB数据集作为训练数据集,将全连接层的输出类别修改为 6 种。在训练过程中,采用了余弦退火学习率调度策略,动态调整学习率,使模型在训练初期能够快速收敛,后期能够更精细地调整参数。
项目成就
采用网格搜索法设置3*3的网格调整batch-size、学习率等超参数进行训练,在测试数据集中准确率可达95%,精确率达到了93%,召回率为92%,F1 值为 92.5%,表明模型在零件缺陷分类任务上具有较高的准确性和可靠性。
中医问答大模型-本草悟道
2024.03-2024.05| 主负责人
项目经历
基于Qwen1.5-14B开发中医问答大模型,利用Langchain的文档加载与智能分割技术,高效处理了Hugging Face平台上的TCM、MLEC-QA等结构化数据集,以及中医古籍文献等非结构化数据集。引入检索增强生成(RAG)技术,使用acge_text_embedding模型作为Embedding模型,运用俄罗斯套娃表征学习(MRL)产生可变维度嵌入向量,基于Milvus构建向量数据库,通过检索知识为模型提供上下文,提升中医问答能力。借助Langchain的多模态接口集成能力,将基座模型和文生图(Stable Diffusion)模型进行集成,解决用户生成中医药图片的需求。模型训练中引入LoRA微调来代替全微调,冻结基座模型的所有Embedding层和LayerNorm层,仅对Query和Value 矩阵进行低秩(R=8)分解,可训练参数较原模型减少约 99.98%(14B->2.8M),使训练时间缩短 40%。
项目成就
经RAG技术与LoRA微调加持后,模型在神农中医药数据集上的问答准确率达 89.7%,较基座模型提升12%,文生图通过CLIP模型计算相似度达92%,实现中医问答与多模态功能高效落地。
竞赛获奖
全球校园人工智能算法精英大赛
2024.11 | 一等奖
赛题要求
参与“AI 生成人脸图像鉴别”竞赛,聚焦现有的AI模型(Stable Diffusion、GAN等)生成的虚假人脸与真实人脸的二分类问题,通过模型结构创新与训练策略优化,提升分类准确率与泛化能力。
解决方法
以YOLOv8为基础模型,针对人脸鉴别任务特性,在BackBone中融入CBAM机制,强化网络对人脸关键特征(如五官纹理、光影分布)的捕捉能力;同时重构Neck与Head层结构,通过调整输出层维度,使模型更适配二分类任务需求。对训练数据集实施多维增广操作,包括高斯模糊模拟图像噪点、饱和度调整增加色彩多样性、随机翻转扩展视角变化,有效缓解模型过拟合问题;通过人脸区域精准裁剪(采用MTCNN算法定位人脸关键点),去除冗余背景信息;采用 AdamW优化器结合余弦退火学习率策略,动态调整训练步长,模型收敛速率显著提升。
竞赛成果
改进后的模型在deepfake数据集CelebA上分类准确率达97.3%,在赛题数据集中准确率达98%,在327支队伍中排名16,荣获国家一等奖。