咨询热线:0755-89999869      政策热线 0755-26978111

精彩回顾|2022年南山博士论坛475期 | 何径舟:人工智能技术及应用

image.png
演讲嘉宾:何径舟,百度深圳研发中心管理委员会联席主席


12月11日,由南山区科协、南山区图书馆主办的南山博士论坛第475期在南山区图书馆二楼报告厅举行。论坛邀请百度深圳研发中心管理委员会联席主席、自然语言处理部技术总监、国家人工智能专业高级工程师何径舟作《人工智能技术及应用》的主题分享。

什么是人工智能,何径舟认为首先它是人工的,这区别于我们自然产生的智能概念,跟生物或者人的智能是有区别的,它最重要的目标是通过计算机或者技术手段能够去模仿、延伸、增强、扩展人的智能的技术。目标并不是说让机器取代人,而是让技术能够帮助人的智能获得更好的延伸和拓展,发挥人更大的智能潜力,这是人工智能最重要的根基。

论坛上,何劲舟以百度的人工智能技术布局为案例为听众讲解人工智能的层次。他介绍,第一个基础层,人工智能技术落地的应用条件需要大量的数据中心和数据算力的支持。最有代表性例子是AI芯片昆仑,比如做人脸识别、语音分析的时候,要遵循深度神经网络的方式模拟人的计算和思考过程,再进一步做加工和推理,这个过程需要AI芯片做知识训练和预测。另一个代表性例子是原场语音交互芯片鸿鹄,语音识别和唤醒功能,我们日常熟悉的siri或者小度就是这个语音交互和识别功能。第二个是深度学习,其实就是人工智能时代的操作系统,操作系统起到承上启下的作用,一方面在底层硬件适配方面做全面布局,同时在上层提供人工智能应用,可以快速适应语音识别、人脸识别、视觉图象等能力。

基于算法、算力、数据的技术底座,能够构成哪些人工智能应用?何劲舟分别从感知层、认知层、跨模态技术方面介绍了人工智能的应用。

感知层,和人的认知是一样的,人能够去看到、听到,同样让计算机能够看到和听到,是人工智能非常重要的能力。听觉上的能力就是语音识别功能,通过输入法产品技术把人类语言识别出来,另一个是语音合成,如果说语音识别是让机器听出人说的话,反过来说语音合成就是让机器能够说出让人能够听的懂的语言。视觉上的能力,如给老视频上色,通过AI技术给视频配上了音效,填上了相应的色彩,包括在清晰度上也做了大量修复,使的我们能够更好了解和学习在历史上我们所积累下来的知识和经验。还有一个技术叫XR,包括AR增强现实和VR虚拟现实,是综合人的感知和状态做一个升级,让人能够看到在现实中并不存在的一些事物,进而帮助人更好的跟环境进行交互和理解。

认知层,让计算机像人一样进行视觉交互,语音交互,包括综合各种感官的交互,我们把这种交互获得的结果进行理解,推理,推断,总结,获得认知能力的过程。在这个基础会涉及到语言的理解和生成,语言的理解就是给计算机一句话,计算机对它进行句法分析、词法分析、情感分析等等。语言生成相对应的就是将计算机生成人所能够理解出的篇章、对话包括摘要等等,这些构建了一系列语言为基础的核心应用,比如百度搜索、人机对话、智能写作。然而实现这些需要具备形成知识之后,下一步要进行语言理解和生成的工作。何劲舟提到,这过程需要大模型,大模型就是把知识通过一种模型化构建的方式让机器能够对知识进行理解,使计算能力能够获得更好的效果体现,从而做到举一反三。

跨模态技术,比较有代表性的应用是目前很火的AI作画,是人工智能技术自动生成画作。不管是抽象的概念性的画,还是非常具体的精度高的画,只要能描述出来,计算机就可以绘画出来。还有虚拟人和数字人做新闻播报,涉及到视频生成技术,综合视觉生产、语音合成,包括素材的综合整理,最后能够自动化的完成新闻播报。

关于人工智能典型的产品和应用方面,何径舟认为,目前人工智能技术已经有一些产品呈现形态包括落地的能力,如果将技术综合起来,能完成更进一步、有实际社会价值的具体工作。如木地板外观检测、金融风控、医疗卫生大数据、农业智能地块识别、农业生长、自动识别车辆,交通规划,再比如能源行业做电网智能巡检等等。人工智能典型的产品和应用其实已经广泛涉及到生产生活的方方面面,帮助很多行业提升他们的生产和工作的效率。