向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
传统文化,与青春时尚“激情相拥”******
编者按:
当“燃爆”的国产影视、复兴的非遗国粹、跨界联名的国货产品越来越多地出现在大众生活中,热衷“国潮”、喜爱“国风”,成为人们消费观念转变、精神需求“升级”的直观体现,彰显着中国文化不断走向自信自强的鲜明趋势。
有这样一群正在与时代“赛跑”的青年人,让优秀传统文化以新的形式被传承发扬。在他们的世界里,传统并不意味着褪去光环的“老旧物件”,而是代表着新潮、活力和无限可能。让我们一起听听他们的故事,感受古老与青春的“激情相拥”。
【一线讲述】
武夷茶飘出“年轻的味道”
讲述人:国家级高级评茶师、制茶工程师 陈 峰
“仙翁遗石灶,宛在水中央。饮罢方舟去,茶烟袅细香。”这是宋代著名理学家朱熹对武夷“山、水、茶”的动人描绘。武夷山茶叶生产历史悠久,茶文化底蕴深厚。以正山小种、金骏眉为代表的红茶,以武夷岩茶为代表的乌龙茶在武夷山孕育、向世界传播,独特的制作工艺造就了武夷山茶叶特有的色、香、味,让武夷山成为中国茶科技的核心发源地。
武夷山燕子窠茶园晨景。肖文凤摄/光明图片
作为武夷人,我一直酷爱饮茶。杯茗在手,心神俱醉。我也乐于向亲朋好友推荐武夷茶,介绍茶文化。令人欣喜的是,如今,越来越多的年轻人也开始青睐武夷茶,让武夷茶变得更时尚、更新潮了。这得益于近年来武夷山走好茶文化、茶产业、茶科技“三茶”统筹发展之路的探索。“三茶”融合,不仅让武夷茶有了更多“年轻”的味道,也给武夷山乡带来了乡村振兴新气象。
古老的武夷茶,“科技味”“生态味”越来越浓了。这些年,在科技特派员的帮助下,武夷山建起一座座“无化肥无农药”生态茶园,茶叶优品率比以往提高了80%,每公斤生态茶最高能卖到2600元。2022年9月底,武夷山全市11601户茶农、1683家茶企向社会作出了“禁用除草剂,生产无公害茶”的承诺,让茶叶品质更有保障。
年轻人有自己的口感喜好,传统岩茶太霸气,新茶客较难接受,制茶师们就改良工艺细节,让岩茶既有岩骨花香,又滋味甜醇,深受年轻茶客喜爱。
如今,在继承传统制茶工艺精髓的基础上,武夷茶企正持续做优茶品牌、创新茶科技,开展“茶叶种植标准化、茶叶深加工标准化、茶产业服务标准化”三产融合,茶叶生产加工向标准化、机械化、自动化、智能化方向发展。红茶的品饮方式也有所创新,从传统清饮向新式调饮拓展,吸引了更多年轻消费者喝茶、爱茶、懂茶。
种茶靠科技,卖茶靠文化。武夷山是历史上万里茶道的起点。近年来,武夷山挖掘茶道、茶艺、茶馆、茶诗、茶歌、茶戏、茶事、茶俗等茶文化,推动茶产业与旅游、健康养生、文化创意、会展等产业跨界融合。“印象大红袍”“茶世界”“中华茶博园”“万里茶道起点”等精品茶文化项目,成为武夷山著名的IP打卡点,吸引着大量游客前来品赏游玩。
顺应信息化浪潮,武夷山打造了茶产业数字体验模式,促进“茶网融合”,并与电商平台合作,做大“电商经济”,打造了一批以武夷山“桃渊茗”为代表的电商茶企。
“潮起来”的武夷茶,竞争力和影响力越来越强。如今,武夷山茶叶面积15万亩,茶企业4600多家,从业人员12万人,年产值过百亿元。“武夷岩茶”区域品牌价值连续五年位居全国茶叶类第二位、品牌强度第一位。
根据南平市印发的《统筹“茶文化、茶产业、茶科技”高质量发展的意见》,到2025年,这里将建成全域绿色生态茶园,茶叶全产业链产值突破500亿元;到2035年,茶叶全产业链产值达到1000亿元以上,成为世界级茶叶生产、交易、文旅、教育、科研、康养中心。文化赋魂茶产业、科技赋能茶产业,我相信,武夷茶一定会清韵流远、香飘世界。
让文化遗产之美回归时尚现场
讲述人:国家对外文化贸易基地北京国际文化贸易服务中心副主任、非遗策展人 李媛媛
让非遗“潮”起来,是我心心念念的事情,也是我的兴趣所在。2009年,我在中国艺术研究院非物质文化遗产保护研究专业深造时,就暗下决心——让更多人欣赏非遗之美。后来,在非遗行业摸爬滚打了多年,我转型成为一名非遗策展人。
非遗策展人李媛媛在一次非遗光影展上布展。光明图片
在我看来,非遗能连接一切,尤其是激发乡村活力。2019年,我策划了非遗版的“梦想改造家”——“乡村非遗爆改慢直播”。那是一个寒冬,改造地点是风筝传承人的农家大院。经过精心设计,我们把仓库变成风筝精品展厅,以全镜面的方式,打造充满光影意趣的展示空间;营造了光影艺术小院,把院里晾晒的玉米“变”成浪花,上面放上惟妙惟肖的鱼灯,对面搭起龙形风筝,寓意“跃龙门”。这次活动的视频播放量达88万次,互动4万多次。此后,曾经冷清的大院热闹了起来,成为集展示、体验、销售为一体的研学基地。
我们还打造了中国立春文化展示和体验中心。这座建筑坐落于浙江衢州柯城区九华乡妙源村盘山路深处。为了让观众一进门就感受到浓浓的春天气息,我们充分调动“视听嗅味触”五维感官,通过移步换景、科技互动、深度体验,把“看春色、听春声、嗅春花、尝春糕、触春神”融入一馆之中。项目刚落成,就迎来了一批批游学的孩子们,深受他们的喜爱。
“子贡曰”光影艺术空间的改造,也是我践行非遗乡村美学的一项得意之作。我把河南浚县古城的古粮仓与子贡的儒商文化结合起来,设计打造了一个奇妙的光影艺术空间——在这里,不锈钢板被弯曲成古粮仓的形状,子贡语录被一束束激光镂空展示,文字的光影铺满整个“粮仓”。展览开放后收获了大量粉丝,很多小朋友一进来就忍不住奔跑,踩着每个文字投射在地上的影子,触摸追踪着“跃动”在墙上的影子。通过打卡拍照、品读文字,文化之美自然而然地“种”在了他们心中。
策划展览之余,我还打造了一个“非遗传二代”平台,聚集了一些非遗传承人的后代。我想和这些“传二代”们一起见证非遗的新辉煌。而现实也在不断坚定着我们的信心。近些年,非遗与国产品牌、国际大牌、影视等跨界携手,扩大了“朋友圈”,也在产业领域得到了新收获。
非遗与大众生活的距离越来越近,让非遗回归时尚的路径也越来越多。我将继续用心做一名非遗策展人,让古老文化的魅力跨越时空、直抵人心。
汉服“出圈”,创业者曹县“赶潮”
讲述人:山东菏泽曹县汉服原创产业中心创业者 孟晓霞
2021年5月,山东曹县因为偶然的机缘爆红网络。“走红,是给有准备的城市”,对于创业者而言,又何尝不是这样呢。
上海豫园内上演国风主题表演“仲秋月神游”。新华社发
2014年10月,我跟老公回老家时接触到了曹县电商业,便跃跃欲试,不久后,开起了自己的淘宝店。开张当晚,我们就接到了第一笔订单——500件学士服。为此,我们常要守在服装加工厂门口抢货,辛苦归辛苦,心里却充满了干番事业的热情。后来,我抱着一岁多的儿子回到曹县,在电商大潮里摸爬滚打,一点点地摸索、学习。
2017年,“汉服热”开始兴起。对市场的敏感让我感到,一定要抓住这股潮流。于是,第二年,我们迅速转向汉服“战场”,借助曹县服装产业链,从模仿摸索到独立设计,在各大电商平台甚至跨境电商平台开了数家汉服店,渐渐打开了市场。
以前回曹县,我看到最多的是留守老人、妇女和儿童。后来几年,随着当地服装产业的发展,一些大学生、创业青年陆续返乡,我的老公胡春青就是其中一名返乡博士。我本科是学美术的,服装设计能用上我所学的专业知识,还能发展自己的兴趣,感到很快乐。
从多年前做演出服开始,曹县百姓的生活就有了很大改观。在这里,大部分家庭是妇女把电商事业做起来了,在外打拼的丈夫就回来帮忙,渐渐地,有了越来越多的淘宝村、特色小镇。
产业发展了,腰包鼓起来了,生活也越来越美了。我们在曹县买了车和房,还生了二胎,小日子越过越红火。2017年,我们租用村里的扶贫车间,开起了自己的加工厂,带动周边20个村民和3个贫困户就业。这几年,我们新开了直播,又开始培养带货主播,公司的队伍更壮大了。
2021年上海进博会,我们带着自主设计的曹县汉服亮相会场。当看到大品牌的宣传手册、周边产品、文创产品时,我意识到了差距。虽然我们的汉服已有一定影响力,但产品体系、商业模式都还需要打磨。我下定决心,不仅要做汉服,还要做更多国潮服装,传承传统文化,诠释当代潮流,打开国潮服装的大市场。
除了设计新的潮流产品,创业者要花更多时间修炼“内功”。我老公现在是曹县汉服协会会长。近期,我们正在筹建“曹县汉服原创产业中心”,得到了当地政府在贷款、场地等方面的创业政策支持,中心的仓储和研发由我和老公两个人全盘负责。打造“宇宙中心”的汉服中心,我们不怕忙,只怕自己做不起来。曹县毕竟是个小县城,很难留住或吸引专业人才在此工作。如果我们的汉服原创产业中心成功了,一定会有更多合作伙伴加入我们,壮大曹县汉服产业。
古筝演奏别样人生
讲述人:哔哩哔哩(B站)音乐区up主 墨韵
成为一名B站古筝up主,确实是“意料之外”。大二那年,我抱着试试看的心态,用古筝改编、弹奏了我喜爱的歌曲《千本樱》,没想到,短短几天时间便收获了上百万播放量,成为B站的“镇站之宝”。自此之后,我的古筝up主之路铺开了。
哔哩哔哩(B站)音乐区up主墨韵正在演奏。光明图片
我从六七岁开始学琴,如今已有二十多年。大学期间,我加入学校的古筝社团,时常在学校活动中演出。研究生阶段,我去美国留学,本想毕业后回国当老师。因为一些偶然机遇,我结识了那时已经小有名气的几位同龄up主。在与他们交流的过程中,我看到了年轻人的蓬勃朝气,也仿佛看到了自己未来的更多可能性。一种新的渴望,就此萌生了。
基于大学期间在B站积累的粉丝基础,回国后,我开始继续做自媒体,重新拾起了对古筝的热爱。如何让传统民乐与潮流文化碰撞出火花,是我努力探索的事情。从简单的二次元单曲古筝弹奏,到逐渐拥有自己的团队;从演奏传统民乐,到融入现代流行的音乐元素,我从未停止挖掘传统与流行融合的更多路径。
不少年轻人认为,传统民乐曲高和寡、古旧乏味,但我从不这样看。的确,对于音色独特、个性极强的民族乐器而言,与节奏固定、和弦要求高的流行歌曲融合确实有难度。但对于创作者而言,依然可以尝试创作一些具有中国特色、东方韵味的音乐;对于演奏者而言,也应探索更多新的呈现方式。
古筝早已成为我的“生命之筝”。未来,我还想尝试拍摄关于古筝的纪实性短片,带大家了解乐器背后的故事,让即使不懂古筝的人们,也能够从中获得更有深度和价值的思考。我会沿着这条道路坚定地走下去,传承和创新,将永远是我音乐up主道路上的关键词。
(项目团队:光明日报记者 王美莹、高建进、陈芃朴、赵秋丽、冯帆、王斯敏 光明日报通讯员 高源)
《光明日报》( 2023年01月11日 07版)