KEG实验室
KEG实验室简介
燕山大学计算机系知识工程组实验室(KEG)成立于2006年,目前实验室负责人为宫继兵老师,博导1人,教授2人,副教授4人,讲师1人。主要研究方向包括:大数据、深度学习、数据获取、人工智能大模型及应用等。实验室纵向科研项目和横向实践项目并重,长期承担国家级项目、以及部委和企业合作项目,包括国家自然基金委主任基金、科技部国家重点研发计划项目、河北省自然科学基金面上项目、CCF-智谱AI大模型基金、分布式数据采集及集成软件系统项目等,并牵头主导与北京智谱华章科技有限公司(简称“智谱AI”)建立“燕山大学-智谱AI大数据基础模型联合实验室”。实验室主要科研成果及主要纵向项目历年发展年鉴图,见下图。

在横向实践项目上,实验室立足于燕山大学曾经与新华社、清华大学、智谱AI、协和医院、唐山移动、迁安市工商局等企事业单位展开合作。实验室横向实践项目历年发展年鉴图,见下图。

在学生培养方面,实验室与微软研究院、亚马逊、英特尔、清华、北航、UIC等国内外著名高校研究院展开交流并合作培养,目前实验室共培养研究生50余名,在读研究生近30人。在指导的毕业生中多人获得研究生国家奖学金、校优秀毕业生、CCF全国优秀大学生奖等奖项,在学生培养方面取得了优秀的成绩。毕业学生就业分布在微软Microsoft、大厂Tiktok、抖音、百度、腾讯、阿里、华为等高科技公司,以及国家专利局、研究院、国家电网和国有银行等国企或央企单位。
实验室的发展见下图,这里列举从2007年-至今(2025年)的主要大记事。
KEG联合挖掘中心
以科技大数据挖掘研究为目标,KEG实验室为挖掘分析大规模学术社会网络,成立数据获取及挖掘中心。为线上学术平台提供论文、项目/基金、新闻、中文论文数据、集成及更新检测及抓取服务。研发维护并行可配置互联网科技大数据获取可视化更新检测系统,实现数据集成,并面向报告生成数据分析与挖掘系统。主要开展的研究包括:互联网大数据采集&用户画像技术研究、大规模学术社交网络建模及分析、基于话题生成模型的大数据挖掘分析技术研究。
燕山大学-智谱AI大数据基础模型联合实验室
燕山大学与北京智谱华章科技有限公司(简称“智谱AI”)校企共建“燕山大学-智谱AI大数据基础模型联合实验室”(简称“联合实验室”),见图。

联合实验室具体由燕山大学信息科学与工程学院计算机系牵头合作建立,作为燕山大学第一个实体联合实验室,勇于尝试和探索新的合作发展路径,结合双方实际发展现状,以提升紧密性、突出实践性、强调实用性为主要目标。在基于KEG实验室已有的工作基础上,联合实验室的主要合作内容包括:1)大数据获取、标注及挖掘;2)社交机器人;3)大语言模型;4)网络生态治理;5)人才培养;6)学术交流;7)科研合作;七个主要方面。为深入进行人才培养和校企合作在智谱AI建立研究生联合培养基地,见图。

智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM(chatglm.cn)。此外,智谱AI还推出了认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品,提供智能API服务,链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力。