科创未来|走近“AI四川队”:ChatGPT很“大”,我们的研究很“精”:天天实时

2023-02-28 20:19:41   来源:四川日报-川观新闻

川观新闻记者 吴忧

“四川省有多个优秀的人工智能研究团队。”光标闪烁几秒钟后,ChatGPT用肯定的语气回答记者,“在机器学习、自然语言处理、计算机视觉等领域,他们表现出色。”


(相关资料图)

最近,由开放人工智能研究中心(OpenAI)推出的ChatGPT热度爆表。这是一款先进的聊天机器人模型,由人工智能技术驱动,依靠包罗万象的知识储备,能够像人类一样聊天交流,甚至能完成撰写文案、翻译文本、修饰代码等任务。

它的惊艳亮相,既带来了“热话题”,也引起了“冷思考”。在人工智能研究领域,四川表现如何、有何成效?面对ChatGPT及其背后的OpenAI,素材差距多大、如何追赶?

近日,在询问ChatGPT的同时,记者在成都、绵阳等地,走近多个具有代表性的人工智能研究团队,现场寻找答案。

看底层技术

研究覆盖广泛,部分领域亮点突出

“我们来看图说话。”在电子科技大学未来媒体研究中心,高联丽教授研究团队为记者介绍了一款图像描述模型。向其展示一幅图像,一段文字描述迅速生成,显示在屏幕上。例如,上传一张街拍照片,模型将其描述为“A car running on the road”(在公路上行驶的汽车)。

在最新的Microsoft COCO Image Captioning Challenge(微软COCO图像描述挑战)全球排行榜Top5中,这款模型占据了一席之位,同榜的还有行业巨头,例如微软和阿里。

高联丽介绍,与ChatGPT相同,这是一款典型的人工智能内容生成模型,既能准确感知和理解图像信息,又能用人类的语言加以描述。这样的能力,需要计算机视觉、自然语言处理等人工智能底层技术支持。近年来,团队在这些领域深耕,在IEEE/ACM等国际顶刊顶会发表论文100余篇,实现一次次创新突破。

长虹AI实验室,也是顶刊顶会的常客。在前不久举行的全球语音领域顶级会议INTERSPEECH 2022上,长虹AI实验室提交的3篇技术论文被收录。

声音是人类交流的最便捷方式之一,在人工智能特别是人工智能内容生成领域,语音技术一直都是研究的重点。长虹AI实验室首席科学家展华益告诉记者,在这个方面,长虹AI实验室的创新成果不断涌现,上述3篇论文分别聚焦声纹识别、语音提取和语音质量评价,堪称矩阵式突破。

西南财经大学新财经综合实验室团队。西南财经大学计算机与人工智能学院供图

自然语言处理,是西南财经大学新财经综合实验室的重点研究领域之一,主要部署的研究方向包括文本理解、文本生成等,这也是ChatGPT用到的底层技术。在一个文本摘要模型上,实验室研究员黄鹂“小试牛刀”。

给定一段源文,叙述了一位病人看病的经历,医生为其开便宜药,只花了几块钱。模型给出了四个字:业界良心。“我第一次看到这样的结果,也跟你一样惊讶。”黄鹂笑着说,这个模型采用了一项新技术,生成准确内容摘要的同时可生成多样化拟人词语,这项成果已在人工智能顶级期刊IEEE Transactions on Cybernetics《IEEE控制论学报》上发表。

看实际应用

阶段性成果陆续落地、见到实效

作为长虹AI实验室视觉检测团队的负责人,刘明华最近一直扎在长虹控股集团华丰科技的生产线上。在他面前,首套连接器外观自动化全检系统刚刚投入运行,另一套系统又开始了搭建。

正在调试智能全检设备的长虹AI实验室团队。长虹控股集团供图

华丰科技生产的连接器,是广泛应用于神舟、天宫等航天装备的精密器件。该产品是多面异型体,材质和纹理复杂多变,比头发还细小的裂缝、异物等瑕疵,都可能造成严重故障。

“下线前的外观检测,是重点也是难点。”刘明华介绍,以往主要依靠检测人员通过显微镜观察,国外的行业龙头也是如此。利用人工智能实现自动检测,打通智能制造的“最后一米”,国内外的企业都在挑战。但真正落地见效的,长虹是第一家,填补了国内外行业空白。

连接器进入检测线,要依次通过15个工位,从不同的角度拍下20多张照片。“照片的一个像素大约是0.015毫米,这是人眼借助显微镜也难以达到的水平。”刘明华解释说,在此基础上,人工智能运用计算机视觉、机器学习等技术,识别、判断、分析产品是否有瑕疵、有哪种瑕疵,生成检测分析结果,“一套系统就相当于一个10多人的班组,一天能够完成检测10000余件,看得更准、更快。”

最近,由四川团队牵头的“地空协作的重大灾害监测搜救平台主动认知技术研究”进入结项阶段,这是科技部实施的“新一代人工智能”重大项目之一,电子科技大学计算机科学与工程学院院长、四川省人工智能研究院院长申恒涛教授担任项目负责人。

“研究面向实际应用。”据介绍,一套高效的搜救平台已搭建完成,借助计算机视觉技术,可以对灾害现场进行实时建模,掌握灾害前方现场的最新情况;而通过对地空图像、听觉信息的感知与理解分析,可以对被困人员进行精准定位,判断其身体状态,在此基础上推演出最快、最安全的解救方式,“在地震、洪水等重大灾害场景中,能够大幅提高应急救援效率,并降低搜救人员自身的安全风险。”

看未来规划

不拼“宽度”比“深度”,力求专而精

“我们做不了OpenAI,也做不出ChatGPT。”西南财经大学新财经综合实验室主任刘贵松告诉记者,要开发这样一个通用场景巨复杂的大模型,需要大规模算力和海量数据,成本极其高昂,这并非一个高校团队所长,“我们不拼‘宽度’,比的是‘深度’。”

对于未来的规划,刘贵松表示,将深入贯彻学校“新财经”战略升级,重点聚焦国家和区域经济发展中的痛点难点,积极开展类脑机器学习、计算机视觉、自然语言处理、金融机器人等可信人工智能理论创新和技术攻关,推动创新技术产品研发及产业化示范应用。

“区域经济数字孪生引擎”,是刘贵松和同事正在攻关的一个项目。“在虚拟空间构建一个模型,与现实世界交互映射。”刘贵松解释说,这个孪生引擎可以在更大时空尺度上进行推演,预测区域经济发展趋势,解释其中的影响因素,并提出对策建议,“继续深耕人工智能与数字经济的交叉领域,全力以赴做到专而精。”

在长虹AI实验室首席科学家展华益看来,成为另一家OpenAI、开发另一款ChatGPT,也不应该成为所有企业的目标,“作为制造业企业,我们的研究既要着眼长远,又要立足当下。”

着眼长远,家庭服务机器人将成为人工智能最重要的应用场景之一。“这个机器人应该具备足够多的功能,能做更多家务,还能对话聊天,甚至能带小孩、陪老人等等。”长虹AI实验室家庭服务机器人负责人刘孟红告诉记者,要做这样的机器人,还需要计算机视觉、自然语言处理、语音、即时定位与地图构建等底层技术不断进步,长虹AI实验室已在这些研究方向上全面布局。

让研究成果不断为产业升级赋能,则是当下的重点。“例如家庭服务机器人,目前已经以扫地机器人的形式出现,接下来要利用新技术为其添加新功能,不断演化迭代。”展华益说,帮助工厂提升智能制造水平,也是实验室最重要的任务之一,还要继续在视觉检测方面提升研究和系统集成能力。

标签: 人工智能 自然语言处理 计算机视觉