大数据科学与产业研究院成立于2016年12月27日,是按照国家创新驱动发展战略要求,贯彻落实国家大数据战略和人工智能战略,通过整合相关学科资源而建成的高水平研究实体。揭牌仪式在山西大学举行,山西大学大数据学院和研究院将致力于大数据相关的科学研究、人才培养和产业创新,努力为山西省服务转型综改做出贡献。
概况介绍
山西大学大数据科学与产业研究院成立于2016年12月27日,是按照国家创新驱动发展战略要求,贯彻落实国家大数据战略和人工智能战略,通过整合相关学科资源而建成的高水平研究实体。
研究院以“演化人工智能”为目标,秉持“从数据中智造智能,在进化中提升智能”的学术理念,致力于人工智能、大数据、人工智能安全领域的前沿基础科学问题和共性关键技术问题的探索性研究。设有机器学习与数据挖掘研究中心、机器视觉与信号处理研究中心、人工智能安全研究中心与科研协作中心,建有山西省机器视觉与数据挖掘工程研究中心。
研究院拥有一支含全球高被引科学家、国家高层次领军人才、IEEE Fellow、国家优青、省特聘教授、三晋学者、CCF优博、全国百优博提名奖、省优博/ACM优博在内的高水平人工智能、大数据与人工智能安全领域的高水平研究队伍。
近年来,研究院主持/承担国家基金重点项目、国家重点研发计划、国家优青、军委科技委、国家面上/青年项目等国家级/省部级项目40余项;在AI、JMLR、ML、ACM Trans、IEEE Trans、IJCAI、AAAI、《中国科学》等国内外顶尖期刊和会议发表论文200余篇。
研究院与世界知名高校美国芝加哥大学、伊利诺伊大学、澳大利亚阿德莱德大学、新加坡南洋理工大学、韩国汉阳大学、香港城市大学等国际知名研究机构保持着深度国际合作关系;建有“中美EPRI联合实验室”、“中-新大数据安全国际联合实验室”等国际合作研究平台。
研究院致力于人工智能与大数据相关的科学研究、人才培养和技术创新,以计算机科学与技术、统计学为支撑学科,融通其它学科进行深度交叉研究,努力建成在全国具有影响力的数据生产集成平台、数据智能研发基地、数据价值创造工场、数据人才培养高地,成为政产学研教合作建设的创新型研究院典范。
下设四个研究中心,分别为机器学习与数据挖掘中心、机器视觉与信号处理中心、人工智能安全中心、科研协作中心。
拥有两个平台,分别为山西省机器视觉与数据挖掘工程研究中心、山西省人工智能交叉创新双创示范平台。
科研平台
机器学习与数据挖掘中心
部门介绍
机器学习实验室的主要针对机器学习领域传统方向和前沿方向开展基础性研究和部分示范性应用,旨在解决领域关键科学问题、突破机器学习算法和理论的局限性、推动人工智能的生态发展。
研究方向
(1)机器学习,主要针对机器学习的热门方向和经典方向,结合多领域交叉学科,开展基础理论研究,解决领域关键科学问题。
(2)统计学习理论,主要研究学习的统计性能、学习算法的收敛性、学习过程的复杂性,构建消除随机一致性后的学习系统的统计学习理论体系。
(3)强化学习,主要以当前强化学习最具代表性的模型AlphaZero为基础,研究棋类游戏自博弈模型的性能界;研究多臂赌博机最优臂确认问题的泛化性能界,探索蒙特卡罗树搜索最优动作的算法和性能界。
(4)对抗学习,主要针对传统机器学习的不安全性,探索系统的漏洞并提出合理的攻击策略,有效地评估防守系统的性能,旨在研究防守者与攻击者之间的利益均衡。
(5)集成学习,主要研究有效的集成策略,在从理论上回答集成学习为什么有效的根本问题。
(6)迁移学习,主要研究可迁移条件和有效迁移策略。
(7)概念学习,主要关注概念学习的3个内涵:概念自身的学习,概念间关系的学习(亦即概念网络的学习),基于概念的推理模式的学习。
未来预期
(1)突破机器学习算法和理论,解决领域关键科学问题;
(2)创新学习理论方法与应用,推动人工智能生态发展。
部门介绍
数据挖掘实验室成立于2016年,旨在发展可从海量数据中挖掘出潜在的、前所未有知识的创新技术,专注突破关联学习机制、复杂网络演化和控制机理、学术合作关系模式和进化智能原理等关键技术,为综合、复杂、多方位的大数据处理系统提供独立的数据处理模块。
研究方向
(1)关联学习研究,主要探索生物关联认知能力和关联思维的数学模型或计算模型,解决关联关系挖掘从无监督到有监督的学习机制与理论原理;
(2)复杂网络结构演化和控制研究,主要探索复杂网络的演化机理和动力学原理,解决网络演化中拓扑结构的演化动力学技术;
(3)学术合作关系挖掘研究,主要探索学术合作网络中的隐模型和动态演化原理,解决构建学术合作图谱和高效合作机制的关键技术;
(4)进化智能基础理论与关键技术研究,主要探索进化智能中的进化原理和演化优化技术,解决智能算法缺乏任务适应性、场景适应性和动态适应性等挑战性问题。
未来预期
(1) 突破关联学习的数学模型和理论原理,实现关联关系挖掘从无监督到监督的转化;
(2)建立复杂网络的动态演化模型和实现网络演化的优化策略算法;
(3)突破进化智能基础理论与关键技术等核心问题,设计通用智能进化算法。
部门介绍
知识产权大数据实验室成立于2017年,知识产权大数据实验室旨在使用大数据分析、文本分析、社交网络分析以及机器学习的方法对学术数据和专利数据进行深度挖掘,针对学者学术评价、研究趋势预测、合作模式挖掘等方面进行研究,并建立一个拥有自主知识产权的融合专利、学者出版物等科研成果的知识产权大数据平台。
研究方向
(1)专利信息检索,主要针对专利数据的语言描述特点、结构特点、图片特点等,构建垂直领域的专用信息搜索引擎;
(2)竞争者发现,根据专利权利要求、专利申请人、专利发明人、市场动态等信息,探索专利申请人之间的竞争关系;
(3)学术评价,利用专利、学者出版物、公开的项目申报信息等数据,研究学者、机构的成果价值、科研能力、创新能力等评价模型。
(4)合作者推荐,根据学者在专利、出版物等方面的研究点,研究学者之间的研究特色,推荐相关的合作者。
未来预期
(1)研发一套具有自主知识产权的知识产权大数据服务平台,为科研工作者、政府、企业提供科技导航、创新评价等服务;
(2)形成一套完善的学术评价、竞争者发现、合作者推荐的数据分析模型;
(3)突破文本表示、文本摘要、分布式索引、语义化检索等信息检索的关键技术,设计高效专门的专利检索算法。
部门介绍
数据智能项目部成立于2018年,旨在研究大数据、深度学习、NLP等关键技术,研制面向行业应用的系统平台,构建数据+算法+平台三位一体的解决方案,打造一流的学术和交付团队,助力数字化转型升级。
研究方向
(1)大数据处理技术系统研发,主要探索面向不同领域的大数据全生命周期采集、存储和计算等核心技术和架构,推动大数据技术与系统的应用落地。
(2)AI+RPA技术与系统研发,主要探索数据平台和算法平台等核心智能技术,提升RPA在复杂场景非结构化数据处理能力和感知能力。
(3)智能抽取技术与系统研发,主要探索借助深度学习、NLP等技术从富格式文档和图表中提取结构化数据,拓展业务数字化边界。
未来预期
(1)突破一批技术、系统及应用中的瓶颈问题;
(2)打造数据智能驱动的拥有核心知识产权的应用系统;
(3)培养一批掌握大数据和人工智能专门技术的高级软件工程师。
机器视觉与信号处理中心
部门介绍
深度感知与机器人实验室成立于2018年,旨在突破机器人在底层设计、场景理解、自主定位导航及多传感器信息融合等方面关键技术,构建面向深度感知技术的机器人与外界环境智能“观测”、“交互”及“认知”解决方案。
研究方向
(1)弱光场景感知研究,主要探索低照度环境下的视觉信号增强技术和高动态清晰成像技术,解决机器人对外界环境的“观测”问题;
(2)ROS机器人技术研究,主要探索基于ROS系统的自主导航与定位、机器人视觉及多传感器融合技术,解决机器人与外界环境的“交互”问题;
(3)机器人智能感知研究,主要探索基于深度学习算法的目标位姿估计、抓取检测技术,未知场景地图实时构建与自主定位技术,解决机器人对外界环境的“认知”问题;
(4)信号处理技术与系统研究,主要探索多模态信息感知、信号处理与传输及深度学习技术,解决机器人与外界环境的“理解”问题。
(5)嵌入式实时系统研究,主要探索基于多核异构实时系统的调度算法研究,解决机器人自身的“计算”问题。
未来预期
(1)突破弱光环境感知、底层系统设计、多传感器融合、目标检测等方面的若干核心问题;
(2)具备产业发展精准对接的能力,打造智能设备的研发基地,提供智能机器人技术的社会服务;
(3)培养一批能服务于智能机器人行业的高端工程师。
部门介绍
语音语言实验室成立于2018年,旨在突破特定/开放环境声纹识别、脑信号分析、多模态数据分析、逻辑学习等领域关键技术,构建面向企业/个人的声纹识别、语义搜索、多模态数据检索解决方案。
研究方向
(1)声纹识别研究,主要探索基于深度学习的声纹识别技术,并结合语音识别、音频检索等技术,解决特定环境下声纹识别的实际应用问题;
(2)语言分析研究:主要探索基于深度学习、知识图谱的自然语言技术,解决面向大数据舆情分析、面向特定领域的语义搜索,人机对话等问题;
(3)情感脑电信号识别研究,主要探索基于信号处理和认知心理学的脑电信号分析及识别技术,解决情感脑电信号的有效识别问题;
(4)多模态机器学习研究,包括表示(representation)、转换(translation)、对齐(alignment)、融合(fusion)和互相学习(co-learning) 5个基本任务,旨在创建可以处理和关联来自多个模态信息的模型;
(5)逻辑学习,主要探索基于数据驱动的逻辑学习技术,解决逻辑可学习问题。
未来预期
(1)推进声纹识别、脑电信号分析、大数据舆情分析、识别等产品落地;
(2)解决多模态数据融合中语义不一致等核心问题;
(3)奠定逻辑学习基本的理论基础。
实验室概况:
机器视觉实验室是山西大学大数据科学与产业研究院下属的科研部门,致力于如何使计算机具有“看”的功能,着眼于计算机视觉方面的基础理论创新和关键技术突破,努力打造成为国内一流的计算机视觉研究团队,为我国的信息技术,大数据产业等培养一流的专业人才。
实验室主要在计算机视觉基础理论与感知、多模态数据融合与分析、医学图像处理及三维重建等方面展开科学研究。
研究方向:
图像和视频分析:主要以海量的图像和视频数据为研究对象,综合运用模式识别、人工智能和计算机视觉的理论与方法,对图像和视频中的目标属性和高层语义进行挖掘。
图像三维重建:主要研究如何通过二维图像恢复真实世界的三维结构的理论和方法。本方向主要以微制造与生命科学领域中的显微尺度对象为研究基础,旨在通过高分辨率二维图像序列实现显微对象的高精度三维重建。
医学图像分割:医学图像分割是将原始的2D或3D图像划分成不同性质的区域,从而把感兴趣的区域提取出来,是图像理解的基础。本方向以医学图像大数据为背景,对疾病诊断、图像引导手术以及医学数据可视化等有重要作用,旨在为临床诊疗和病理学研究提供可靠的依据。
未来预期:
⑴ 旨在突破智能图像视频分析,高层语义理解等方面的基础理论和方法,解决实际应用场景中面临的关键科学问题。
⑵ 力争在显微图像的静态和动态三维重建方面实现理论突破,解决微制造和生命医学领域三维重建面临的关键科学问题。
⑶ 期望在医学图像,特别是脑图像分割方面实现理论或方法突破,解决疾病诊断,图像引导手术等方面面临的关键科学问题。
部门介绍
EPRI中美联合实验室成立于2019年,旨在研究并突破医学图像重建技术和EPRI成像技术中的关键科学问题,构建基础研究、仪器研发和医学应用三位一体的学术平台,打造一流的学术团队,服务人类健康事业。
研究方向
(1)图像重建算法研究,主要探索成像理论与先进算法,解决成像领域中核心重建算法的性能提升问题。
(2)EPRI技术与系统,主要探索EPRI图像重建算法与成像仪研制,解决EPRI产业化的基础研究问题。
(3)EPRI成像应用研究,主要探索EPRI在肿瘤精准放疗中的应用,解决放疗的疗效提升问题。
未来预期
(1)突破一批技术、系统及应用中的瓶颈问题;
(2)将实验室建成国内知名的医学成像实验室;
(3)培养一批优秀的医学成像技术专门人才。
人工智能安全中心
部门介绍
该中心成立于2019年,旨在突破软硬件系统漏洞检测、大数据加密、网络安全态势感知、智能电网安全等领域关键技术,构建面向大数据、云平台下的代码级漏洞检测及数据隐私防护解决方案。
研究方向
(1)代码级漏洞检测研究,主要探索基于源代码和二进制代码的漏洞检测技术及基于知识图谱的漏洞依赖分析技术,解决网络安全中“系统层”的安全问题;
(2)大数据防护技术研究,主要探索基于属性的公钥加密方法、区块链数据安全与隐私保护及量子密码研究,解决网络安全中“数据层”的安全问题;
(3)安全态势感知研究,主要探索基于机器学习算法的异常流量检测和网络安全态势感知技术,解决网络安全“管理层”的安全问题;
(4)安全防御策略研究,主要探索云平台下主动防御技术及智能电网中数据完整性攻击的防御策略,解决网络安全中“应用层”的安全问题。
未来预期
(1)突破网络漏洞检测、数据隐私防护、安全态势感知领域的若干核心问题;
(2)具备向社会提供安全技术服务能力,打造山西省内网络安全产学研高地;
(3)培养一批能在网络安全领域开展科学研究及技术工程化应用的高端人才;
科研协作中心
中心介绍:
科研协作中心负责研究院日常事务性工作。
(1)负责科研管理、项目管理、资产管理、财务管理等管理工作;
(2)负责科技交流、宣传推广、产业接洽、外国专家等行政工作;
(3)负责安全保卫、日常接待、外语翻译、文章润色等事务工作;
山西省机器视觉与数据挖掘工程研究中心
山西省机器视觉与数据挖掘工程研究中心于2020年7月获山西省发展和改革委员会批准成立,中心依托山西大学大数据科学与产业研究院和计算机信息与技术学院,围绕图像和视频分析、夜间视觉信息增强技术、科研合作模式挖掘、网络安全检测等多个前沿方向开展攻关,力争从理论、方法及技术层面进行源头创新,将机器视觉与数据挖掘技术领域的科研成果推向市场,建设国内一流的人工智能领域工程研究中心。
山西省人工智能交叉创新双创示范平台
山西省人工智能交叉创新双创示范平台于2022年7月由山西省发展改革委员会批准建设的省部级创新创业示范平台,平台依托山西大学大数据科学与产业研究院、计算机科学与技术学院和山西省机器视觉与数据挖掘工程研究中心,围绕“人工智能基础研究、空间无人系统智能控制、计算成像与战场视觉感知、网络空间攻防学习与态势感知和智能病理分析与肿瘤诊断”等领域,构建能激发科技发展内生力的理论创新平台,打造创新能力突出、工程技术先进的技术研发中心,设立多学科联合、多方参与的开放式人工智能人才培养基地,创建具有鲜明地域特色与技术特色、省内一流的高水平人工智能交叉科技研发高地与经济转型助推器。