科创未来｜走近“AI四川队”：ChatGPT很“大”，我们的研究很“精”:天天实时

2023-02-28 20:19:41 来源：四川日报-川观新闻

川观新闻记者吴忧

“四川省有多个优秀的人工智能研究团队。”光标闪烁几秒钟后，ChatGPT用肯定的语气回答记者，“在机器学习、自然语言处理、计算机视觉等领域，他们表现出色。”

(相关资料图)

最近，由开放人工智能研究中心（OpenAI）推出的ChatGPT热度爆表。这是一款先进的聊天机器人模型，由人工智能技术驱动，依靠包罗万象的知识储备，能够像人类一样聊天交流，甚至能完成撰写文案、翻译文本、修饰代码等任务。

它的惊艳亮相，既带来了“热话题”，也引起了“冷思考”。在人工智能研究领域，四川表现如何、有何成效？面对ChatGPT及其背后的OpenAI，素材差距多大、如何追赶？

近日，在询问ChatGPT的同时，记者在成都、绵阳等地，走近多个具有代表性的人工智能研究团队，现场寻找答案。

看底层技术

研究覆盖广泛，部分领域亮点突出

“我们来看图说话。”在电子科技大学未来媒体研究中心，高联丽教授研究团队为记者介绍了一款图像描述模型。向其展示一幅图像，一段文字描述迅速生成，显示在屏幕上。例如，上传一张街拍照片，模型将其描述为“A car running on the road”（在公路上行驶的汽车）。

在最新的Microsoft COCO Image Captioning Challenge（微软COCO图像描述挑战）全球排行榜Top5中，这款模型占据了一席之位，同榜的还有行业巨头，例如微软和阿里。

高联丽介绍，与ChatGPT相同，这是一款典型的人工智能内容生成模型，既能准确感知和理解图像信息，又能用人类的语言加以描述。这样的能力，需要计算机视觉、自然语言处理等人工智能底层技术支持。近年来，团队在这些领域深耕，在IEEE/ACM等国际顶刊顶会发表论文100余篇，实现一次次创新突破。

长虹AI实验室，也是顶刊顶会的常客。在前不久举行的全球语音领域顶级会议INTERSPEECH 2022上，长虹AI实验室提交的3篇技术论文被收录。

声音是人类交流的最便捷方式之一，在人工智能特别是人工智能内容生成领域，语音技术一直都是研究的重点。长虹AI实验室首席科学家展华益告诉记者，在这个方面，长虹AI实验室的创新成果不断涌现，上述3篇论文分别聚焦声纹识别、语音提取和语音质量评价，堪称矩阵式突破。

西南财经大学新财经综合实验室团队。西南财经大学计算机与人工智能学院供图

自然语言处理，是西南财经大学新财经综合实验室的重点研究领域之一，主要部署的研究方向包括文本理解、文本生成等，这也是ChatGPT用到的底层技术。在一个文本摘要模型上，实验室研究员黄鹂“小试牛刀”。

给定一段源文，叙述了一位病人看病的经历，医生为其开便宜药，只花了几块钱。模型给出了四个字：业界良心。“我第一次看到这样的结果，也跟你一样惊讶。”黄鹂笑着说，这个模型采用了一项新技术，生成准确内容摘要的同时可生成多样化拟人词语，这项成果已在人工智能顶级期刊IEEE Transactions on Cybernetics《IEEE控制论学报》上发表。

看实际应用

阶段性成果陆续落地、见到实效

作为长虹AI实验室视觉检测团队的负责人，刘明华最近一直扎在长虹控股集团华丰科技的生产线上。在他面前，首套连接器外观自动化全检系统刚刚投入运行，另一套系统又开始了搭建。

正在调试智能全检设备的长虹AI实验室团队。长虹控股集团供图

华丰科技生产的连接器，是广泛应用于神舟、天宫等航天装备的精密器件。该产品是多面异型体，材质和纹理复杂多变，比头发还细小的裂缝、异物等瑕疵，都可能造成严重故障。

“下线前的外观检测，是重点也是难点。”刘明华介绍，以往主要依靠检测人员通过显微镜观察，国外的行业龙头也是如此。利用人工智能实现自动检测，打通智能制造的“最后一米”，国内外的企业都在挑战。但真正落地见效的，长虹是第一家，填补了国内外行业空白。

连接器进入检测线，要依次通过15个工位，从不同的角度拍下20多张照片。“照片的一个像素大约是0.015毫米，这是人眼借助显微镜也难以达到的水平。”刘明华解释说，在此基础上，人工智能运用计算机视觉、机器学习等技术，识别、判断、分析产品是否有瑕疵、有哪种瑕疵，生成检测分析结果，“一套系统就相当于一个10多人的班组，一天能够完成检测10000余件，看得更准、更快。”

最近，由四川团队牵头的“地空协作的重大灾害监测搜救平台主动认知技术研究”进入结项阶段，这是科技部实施的“新一代人工智能”重大项目之一，电子科技大学计算机科学与工程学院院长、四川省人工智能研究院院长申恒涛教授担任项目负责人。

“研究面向实际应用。”据介绍，一套高效的搜救平台已搭建完成，借助计算机视觉技术，可以对灾害现场进行实时建模，掌握灾害前方现场的最新情况；而通过对地空图像、听觉信息的感知与理解分析，可以对被困人员进行精准定位，判断其身体状态，在此基础上推演出最快、最安全的解救方式，“在地震、洪水等重大灾害场景中，能够大幅提高应急救援效率，并降低搜救人员自身的安全风险。”

看未来规划

不拼“宽度”比“深度”，力求专而精

“我们做不了OpenAI，也做不出ChatGPT。”西南财经大学新财经综合实验室主任刘贵松告诉记者，要开发这样一个通用场景巨复杂的大模型，需要大规模算力和海量数据，成本极其高昂，这并非一个高校团队所长，“我们不拼‘宽度’，比的是‘深度’。”

对于未来的规划，刘贵松表示，将深入贯彻学校“新财经”战略升级，重点聚焦国家和区域经济发展中的痛点难点，积极开展类脑机器学习、计算机视觉、自然语言处理、金融机器人等可信人工智能理论创新和技术攻关，推动创新技术产品研发及产业化示范应用。

“区域经济数字孪生引擎”，是刘贵松和同事正在攻关的一个项目。“在虚拟空间构建一个模型，与现实世界交互映射。”刘贵松解释说，这个孪生引擎可以在更大时空尺度上进行推演，预测区域经济发展趋势，解释其中的影响因素，并提出对策建议，“继续深耕人工智能与数字经济的交叉领域，全力以赴做到专而精。”

在长虹AI实验室首席科学家展华益看来，成为另一家OpenAI、开发另一款ChatGPT，也不应该成为所有企业的目标，“作为制造业企业，我们的研究既要着眼长远，又要立足当下。”

着眼长远，家庭服务机器人将成为人工智能最重要的应用场景之一。“这个机器人应该具备足够多的功能，能做更多家务，还能对话聊天，甚至能带小孩、陪老人等等。”长虹AI实验室家庭服务机器人负责人刘孟红告诉记者，要做这样的机器人，还需要计算机视觉、自然语言处理、语音、即时定位与地图构建等底层技术不断进步，长虹AI实验室已在这些研究方向上全面布局。

让研究成果不断为产业升级赋能，则是当下的重点。“例如家庭服务机器人，目前已经以扫地机器人的形式出现，接下来要利用新技术为其添加新功能，不断演化迭代。”展华益说，帮助工厂提升智能制造水平，也是实验室最重要的任务之一，还要继续在视觉检测方面提升研究和系统集成能力。

标签：人工智能自然语言处理计算机视觉