GMC_CV

关于我

为人诚实正直、稳重谦虚，最大的优点是对待工作严谨认真，一丝不苟，拥有较强的学习能力同时注重工作效率和团队合作意识。日常生活中乐于沟通协调，待人谦逊，能够在各项事务性工作和日程安排下有较为出色的表现。注重学习，乐于接受新事物，有一定的创新创造能力。

籍贯：广东湛江

生日：1998.12.11

政治面貌：中共党员

电子邮箱：gmc9812@163.com

电话：15917582764

个人特点

严谨认真
善于学习
团队协作
肯吃苦

教育经历

2022 - 2025

佛山大学

软件工程 | 硕士研究生 | 全日制

平均成绩：88.6（专业排名3/29）

2022.9-2025.6 担任佛山大学22软件工程班长

2017 - 2021

五邑大学

通信工程 | 本科 | 普通全日制

GPA：3.55（专业排名21/201）

2017.9-2018.9 担任五邑大学学院自律委员会委员
2018.9-2019.9 担任五邑大学学院自律委员会部长

实习经历

2023.10 - 2024.05

NLP业务开发工程师

中国联合网络通信有限公司佛山市分公司(佛山联通)

负责佛山12345"坐席智能辅助开发"
内容包括热线工单分类算法、以及热线热点主题聚类算法
工单分类算法将原始分类平均准确度提升75%→92%
2022、2023、2024年有效分类工单共计300万条

2021.03 - 2021.06

前端开发工程师

华软科技有限公司

负责公司核心产品的前端开发工作
优化网页、小程序端性能，提升用户体验
月平均修复前端Bug数量50余个，总代码量1.1万余行

项目经历

12345智能工单分类算法

基于佛山12345便民热线提供提供标注样本和待分类数据，设计与训练基于人工智能技术的工单数据自动分类模型。使用多种HTC层级分类算法和模型，包括Bert、Roberta、ERNIE等主流与训练模型。针对包含市场主体、违章建筑举报、噪声污染、招生考试、拖欠工资、售后服务、社保统筹服务7大民生热点以及14项细分类别，设计多层级分类模型，并使用paddle框架进行训练，平均准确率从最初70%多大幅提升至92%。

Paddle Paddle-NLP Transformers

12345工单小助手

基于佛山12345工单数据和知识库开发的工单小助手，采用主流的大模型训练框架和引擎dify、xinference、llama-factory等。基于DeepSeek-R1-Distill-Qwen-7B+RAG开发，全程本地训练和部署，具有通用对话和基于工单知识库的问答能力。

dify xinference llama-factory modelscope

合同比对小程序

具有文档、图像、PDF比对以及印章识别等功能。
使用包括diff在内的多种比对算法，和OCR在内的多种图像处理技术，在uni-app上进行跨平台开发，实现文档、图像、PDF比对以及印章识别等功能。已在微信小程序上线。

Python Diff Uni-app

新闻纠错系统

采用具有词法CSC、语法CGEC和敏感词检测功能。核心算法参考了最新的自然语言处理研究成果，采用CRASpell+Seq2Edit等多模型融合，通过海量中文数据训练与微调，能够自动检测和纠正新闻文本中的错误，并辅以敏感词模块识别过滤。与传统的人工编辑和校对相比，该系统具有速度快、准确性高、可扩展性好等优点，能够大幅提高新闻发布的质量，降低人力成本。

Vue3 Java PyTorch Gunicorn

业绩管理系统

个人独立开发的统计理疗店铺业绩管理系统，已在真实业务场景中应用。功能包括排工、结算、统计汇总、单日管理、单月管理、会员管理、员工管理，项目管理等核心功能。
包括web和小程序两端

SpringBoot Vue Uni-app SQL elementUI Redis

技能专长

开发技能

Python 熟练

PyTorch 熟练

LLM微调与部署熟练

MySQL数据库掌握

Web前端（Vue，JS，uni-app）掌握

Web后端（Java）掌握

Linux 掌握

容器Docker 掌握

C/C++ 一般

证书

英语四级中级软件设计师计算机二级证书机动车驾驶证

科研成果和荣誉

论文发表

Guo M, Han Z, Chen H, et al. A Contrastive Learning of Sample Pairs for Authorship Verification[C]//Aliannejadi M, Faggioli G, Ferro N, et al. Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2023), Thessaloniki, Greece, September 18th to 21st, 2023: Vol. 3497. CEUR-WS.org, 2023: 2608-2612.
Guo M, Han Z, Chen H, et al. A Machine-Generated Text Detection Model Based on Text Multi-Feature Fusion[C]//Faggioli G, Ferro N, Galuscáková P, et al. Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2024), Grenoble, France, 9-12 September, 2024: Vol. 3740. CEUR-WS.org, 2024: 2593-2602.
Guo M, Han Z, Kong L, et al. Advantages of XLM-R Model for Urdu Sentiment Multi-Classification[C]//Ghosh K, Mandl T, Majumder P, et al. Working Notes of FIRE 2022 - Forum for Information Retrieval Evaluation, Kolkata, India, December 9-13, 2022: Vol. 3395. CEUR-WS.org, 2022: 291-297.
Guo M, Han Z, Wang X, et al. Multidimensional Text Feature Analysis: Unveiling the Veil of Automatically Generated Text[C]//Jiménez-Zafra S M, Chiruzzo L, Rangel F, et al. Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2024) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2024), Valladolid, Spain, September 24, 2024: Vol. 3756. CEUR-WS.org, 2024.

国际比赛

EmoThreat@FIRE 2022 国际评测情感分类赛道，获得第一名(1/8)
PAN@CLEF 2023国际评测作者识别赛道，获得第二名(2/20)
IberAuTexTification@IberLEF 2024 国际评测AI生成文本识别和归因，子赛道1获得第二名(2/54)，子赛道2获得第一名(1/14)

软件著作权

文档比对系统V1.0（登记号：2023SR0563463），授权日期：2023.05.24
基于预训练语言模型的文本对齐研究系统V1.0（登记号：2023SR0323004），授权日期：2023.03.13

基金项目

国家社科基金，主要参与人，2024年度融合语言学知识的大语言模型生成文本检测研究，批准号：24BYY080
广东社科基金，主要参与人，2024年度一般项目《大语言模型生成文本的识别、事实性验证和价值观评价研究》，批准号：GD24CZY02

郭明灿

算法 / 开发 / 网络 / NLP / 大模型等方向

关于我

个人特点

教育经历

佛山大学

五邑大学