郭明灿

2025应届硕士毕业生

求职意向:

算法 / 开发 / 网络 / NLP / 大模型 等方向

下载简历
个人头像

关于我

为人诚实正直、稳重谦虚,最大的优点是对待工作严谨认真,一丝不苟,拥有较强的学习能力同时注重工作效率和团队合作意识。日常生活中乐于沟通协调,待人谦逊,能够在各项事务性工作和日程安排下有较为出色的表现。注重学习,乐于接受新事物,有一定的创新创造能力。

籍贯:广东湛江

生日:1998.12.11

政治面貌:中共党员

电子邮箱:gmc9812@163.com

电话:15917582764

个人特点

  • 严谨认真
  • 善于学习
  • 团队协作
  • 肯吃苦

教育经历

2022 - 2025

佛山大学

软件工程 | 硕士研究生 | 全日制

平均成绩:88.6(专业排名3/29)

  • 2022.9-2025.6 担任佛山大学22软件工程 班长
2017 - 2021

五邑大学

通信工程 | 本科 | 普通全日制

GPA:3.55(专业排名21/201)

  • 2017.9-2018.9 担任五邑大学学院自律委员会委员
  • 2018.9-2019.9 担任五邑大学学院自律委员会部长

实习经历

2023.10 - 2024.05

NLP业务开发工程师

中国联合网络通信有限公司佛山市分公司(佛山联通)

  • 负责佛山12345"坐席智能辅助开发"
  • 内容包括热线工单分类算法、以及热线热点主题聚类算法
  • 工单分类算法将原始分类平均准确度提升75%→92%
  • 2022、2023、2024年有效分类工单共计300万条
2021.03 - 2021.06

前端开发工程师

华软科技有限公司

  • 负责公司核心产品的前端开发工作
  • 优化网页、小程序端性能,提升用户体验
  • 月平均修复前端Bug数量50余个,总代码量1.1万余行

项目经历

项目预览

12345智能工单分类算法

基于佛山12345便民热线提供提供标注样本和待分类数据,设计与训练基于人工智能技术的工单数据自动分类模型。 使用多种HTC层级分类算法和模型,包括Bert、Roberta、ERNIE等主流与训练模型。 针对包含市场主体、违章建筑举报、噪声污染、招生考试、拖欠工资、售后服务、社保统筹服务7大民生热点以及14项细分类别, 设计多层级分类模型,并使用paddle框架进行训练,平均准确率从最初70%多大幅提升至92%。

Paddle Paddle-NLP Transformers
项目预览

12345工单小助手

基于佛山12345工单数据和知识库开发的工单小助手,采用主流的大模型训练框架和引擎dify、xinference、llama-factory等。 基于DeepSeek-R1-Distill-Qwen-7B+RAG开发,全程本地训练和部署,具有通用对话和基于工单知识库的问答能力。

dify xinference llama-factory modelscope
项目预览

合同比对小程序

具有文档、图像、PDF比对以及印章识别等功能。
使用包括diff在内的多种比对算法,和OCR在内的多种图像处理技术, 在uni-app上进行跨平台开发,实现文档、图像、PDF比对以及印章识别等功能。 已在微信小程序上线。

Python Diff Uni-app
项目预览

新闻纠错系统

采用具有词法CSC、语法CGEC和敏感词检测功能。核心算法参考了最新的自然语言处理研究成果,采用CRASpell+Seq2Edit等多模型融合,通过海量中文数据训练与微调,能够自动检测和纠正新闻文本中的错误,并辅以敏感词模块识别过滤。与传统的人工编辑和校对相比,该系统具有速度快、准确性高、可扩展性好等优点,能够大幅提高新闻发布的质量,降低人力成本。

Vue3 Java PyTorch Gunicorn
项目预览

业绩管理系统

个人独立开发的统计理疗店铺业绩管理系统,已在真实业务场景中应用。 功能包括排工、结算、统计汇总、单日管理、单月管理、会员管理、员工管理,项目管理等核心功能。
包括web和小程序两端

SpringBoot Vue Uni-app SQL elementUI Redis

技能专长

开发技能

Python 熟练
PyTorch 熟练
LLM微调与部署 熟练
MySQL数据库 掌握
Web前端(Vue,JS,uni-app) 掌握
Web后端(Java) 掌握
Linux 掌握
容器Docker 掌握
C/C++ 一般

证书

英语四级 中级软件设计师 计算机二级证书 机动车驾驶证

科研成果和荣誉

论文发表

  1. Guo M, Han Z, Chen H, et al. A Contrastive Learning of Sample Pairs for Authorship Verification[C]//Aliannejadi M, Faggioli G, Ferro N, et al. Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2023), Thessaloniki, Greece, September 18th to 21st, 2023: Vol. 3497. CEUR-WS.org, 2023: 2608-2612.
  2. Guo M, Han Z, Chen H, et al. A Machine-Generated Text Detection Model Based on Text Multi-Feature Fusion[C]//Faggioli G, Ferro N, Galuscáková P, et al. Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2024), Grenoble, France, 9-12 September, 2024: Vol. 3740. CEUR-WS.org, 2024: 2593-2602.
  3. Guo M, Han Z, Kong L, et al. Advantages of XLM-R Model for Urdu Sentiment Multi-Classification[C]//Ghosh K, Mandl T, Majumder P, et al. Working Notes of FIRE 2022 - Forum for Information Retrieval Evaluation, Kolkata, India, December 9-13, 2022: Vol. 3395. CEUR-WS.org, 2022: 291-297.
  4. Guo M, Han Z, Wang X, et al. Multidimensional Text Feature Analysis: Unveiling the Veil of Automatically Generated Text[C]//Jiménez-Zafra S M, Chiruzzo L, Rangel F, et al. Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2024) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2024), Valladolid, Spain, September 24, 2024: Vol. 3756. CEUR-WS.org, 2024.

国际比赛

  • EmoThreat@FIRE 2022 国际评测情感分类赛道,获得第一名(1/8)
  • PAN@CLEF 2023国际评测作者识别赛道,获得第二名(2/20)
  • IberAuTexTification@IberLEF 2024 国际评测AI生成文本识别和归因,子赛道1获得第二名(2/54),子赛道2获得第一名(1/14)

软件著作权

基金项目

  • 国家社科基金,主要参与人,2024年度融合语言学知识的大语言模型生成文本检测研究,批准号:24BYY080
  • 广东社科基金,主要参与人,2024年度一般项目《大语言模型生成文本的识别、事实性验证和价值观评价研究》,批准号:GD24CZY02

荣誉证书

研究生阶段:

  • 2022获研究生一等学业奖学金
  • 2023获研究生一等学业奖学金、优秀研究生干部
  • 2024获研究生二等学业奖学金、获得优秀研究生

本科阶段:

  • 2018获校级奖学金及三好学生、优秀共青团员
  • 2019获校级奖学金及三好学生、优秀团员标兵、优秀学生干部
  • 2020获校级奖学金及三好学生
  • 2021优秀志愿者、优秀毕业生