人工智能:新技术涌现 新未来已来
以“智行天下 能动未来”为主题的2024世界智能产业博览会近日在国家会展中心(天津)闭幕。此次博览会迎来观众21万人次,相关报道全网累计传播16万条,累计总阅读量708万次;微博平台话题阅读量和抖音平台播放量超过1亿。
《中国新闻出版广电报》记者在现场看到,这里汇集了来自智能科技领域的众多前沿新产品、新技术、新成果,其中一些人工智能技术已经渗透到相关行业的各个环节,多维度赋能新闻出版广电业发展。
大模型赋予虚拟人更多角色
在人工智能展区,科大讯飞重点展示了讯飞星火大模型。面对观众五花八门的提问,讯飞星火大模型V3.5对答如流,和观众自然而然地聊天,它的“一句话声音复刻”功能,让观众感到既惊喜又亲切。
讯飞虚拟人平台商务总监杜健辅告诉记者,在新闻传播、就医、旅行等很多日常生活场景中,其实早已有讯飞星火大模型的身影。在大模型加持下,虚拟人智能交互机功能更加强大,实现了从问题识别到互动反馈,全方位交互功能的飞跃。
杜健辅介绍,在儿童节上线的《观复猫》动画短剧以焕然一新的AI英文配音版再次与观众见面。值得一提的是,此次全12集的英文配音均由讯飞虚拟人平台提供AI译制同声配音技术支持,可谓是动画配音领域的一大创新性进步。
杜健辅表示,从前,想要复刻、模拟一个人的声音,至少需要人工参与录制长达一周的时间,才能积累足够多的声音数据支持机器学习。现在,借助AI译制同声配音技术,仅需一句话,短短10秒就能实现声音复刻,不仅保留了每个角色独特的音色、韵律,还能高度还原各自的风格特征。
基于讯飞跨语种声音复刻大模型,AI译制同声配音技术还可实现中英跨语种配音,不仅发音标准流利,还支持时间戳匹配和语速微调等功能,实现了跨语种配音的“无缝切换”。AI译制同声配音技术为影视行业带来新变化,音视频的跨语种传播,将进一步拓展海外市场。当前讯飞智作提供的海量高品质音库,可满足新闻播报、教育培训、广告宣传、有声读物等多元场景需求。此外,平台还提供2D真人、3D超写实、卡通、美型等多种风格的虚拟人形象。
校对大模型破解传统校对难题
在2024世界智能产业博览会上,上海蜜度科技股份有限公司发布了文修智能校对大模型3.0版(以下简称文修3.0)。蜜度文修总裁张晓娟介绍,在技术层面,文修3.0引入混合专家模型(MOE)和智能体策略;在校对准确性上,让大模型掌握工具调用能力,在校对过程中自动调用关联工具,进一步提升准确性;在校对速度上,通过专家路由模块激活部分网络,在参数规模扩大的同时,依然保持较高的运算速度。
在产品应用层面,文修3.0可以支持文本、图片、视频等多种内容形态的校对。一本20万字的书稿,90秒即可完成校对工作,有效辅助编辑发现差错。此外,一段90分钟的视频仅需 5分钟即可完成视频拆帧、画面解析、文字识别、语音转换、自动审校等全流程的内容审核工作。
目前,以文修为技术基础的“蜜度校对通”已在党政机关、新闻出版、教育等行业落地。张晓娟表示,文修3.0不仅在模型性能上升级,并且更加贴合出版、媒体、政务等办公应用场景,为千行百业提质增效赋能。
数字出版新技术吸引公众注意力
天津出版传媒集团的天津数字出版产业园也亮相2024世界智能产业博览会,发布了最新技术产品和成果。
现场设置的一个红色邮筒吸引了众多观众的目光,纷纷驻足扫码,等待着一封独属于自己的明信片从邮筒中“吐”出。这是一张具有创新技术的声音明信片,用户不仅可以录制自己的声音、音频,将其转换成二维码形式,嵌入明信片。当亲朋好友收到这张明信片时,只需扫描二维码,就能听到声音或音频信息,让沟通更加生动和真实。
天津教育出版社带来的“津教智云”数字出版平台,面向职业教育和高等教育研发,通过编辑端、教学端、学生端,打通了数字教学与数字出版,提供符合院校“课程教材一体化”需求的新一代数字化教材系统,是教材建设、版权授权、教研管理、教学实训四大功能集成的教材服务平台。
在同方知网的展台上,同方知网与华为携手打造的中华知识大模型,也是同方知网率先面向知识服务与科研行业推出的全学科、全领域、跨行业的专业知识增强大模型,支撑知识服务、科学研究、探究学习、辅政决策等多领域应用场景。
例如,中华知识大模型为图书馆带来了精准智能的知识增强与溯源,实现了人机智能交互,并通过打造一系列的AIGC应用产品,如AI智能写作、智研助手、学术搜问等,为读者提供个性化体验。