值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC2024

sansa2025 sansa2025
5
2025-08-14
  每日财经(Mrcj88.cn)讯:   10月24-26日,2024中国计算机大会(简称CNCC2024)在横店举行。在24日的“AI+影视创作超级论坛”上,中国人民大学高瓴人工智能学院长聘副教授宋睿华围绕与值得买科技合作的首个研究成果《TiVA:Time-aligned Video-to-Audio Generation》(《TiVA:时序同步的视频到音频生成》)进行了主题演讲,具体阐述了该项技术能为内容创作所带来的突破性进展:除了提升AIGC内容生成尤其是声音生成方面的质量和智能化水平之外,也有望为AIGC内容生成带来更丰富的模态和更多想象空间。

  每日财经(Mrcj88.cn)讯:

值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC2024
(图片来源网络,侵删)

  10月24-26日,2024中国计算机大会(简称CNCC2024)在横店举行。在24日的“AI+影视创作超级论坛”上,中国人民大学高瓴人工智能学院长聘副教授宋睿华围绕与值得买科技合作的首个研究成果《TiVA:Time-aligned Video-to-Audio Generation》(《TiVA:时序同步的视频到音频生成》)进行了主题演讲,具体阐述了该项技术能为内容创作所带来的突破性进展:除了提升AIGC内容生成尤其是声音生成方面的质量和智能化水平之外,也有望为AIGC内容生成带来更丰富的模态和更多想象空间。

  本次大会由中国计算机学会主办,是我国计算领域涉及面最广、规模最大、影响力最强的学术、技术、教育和产业盛会。大会以“发展新质生产力,计算引领未来”为主题,邀请图灵奖获得者、国内外院士、国内外计算机领域知名专家和教育家、企业家及专业人士汇聚一堂,共享学术新进展、应用新技术、创意新理念,分享创新成果、展望前沿趋势。

值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC2024
(图片来源网络,侵删)

  据悉,此次的研究成果《TiVA:Time-aligned Video-to-Audio Generation》,在今年7月还被国际多媒体学术会议(ACM International Conference on Multimedia 2024,简称ACM MM 2024)录用,并被选为口头报告。该会议由国际计算机协会(ACM)发起,是多媒体处理、分析与计算领域最具影响力的国际顶级会议。同时,此次研究成果已获得国家发明专利授权(专利名称:音频生成方法、视频生成方法、装置、设备和介质,公开号ZL 202410613827.3)。

  早在2023年6月,值得买科技就与中国人民大学高瓴人工智能学院宋睿华团队达成合作,聚焦大模型、AI内容创作等相关内容研究。除TiVA外,双方还将在近期发布面向电商领域的共享基座检索增强架构(BSharedRAG)、多模态知识增强的视觉信息查询(MuKA)等多个AI研究成果。

  此次TiVA研究成果主要聚焦在多模态内容创作和交互领域。当前,视频和音频的同步生成一直是多模态内容生成的技术挑战,大多数现有方法主要关注匹配视觉和声音模态的语义,而无法在时间对齐上实现精确同步。值得买科技与中国人民大学宋睿华团队通过深入研究,提出了新颖的时序同步的视频到音频生成框架-TiVA,该框架通过音频布局的概念,实现了视频内容到音频的高质量生成。其核心在于音频布局的创新使用,通过低分辨率的Mel频谱图来提供粗略的音频结构布局,帮助模型更好地理解和预测声音的起始和结束时间,从而实现更精确的时间对齐。

  宋睿华具体阐释了TiVA的实现路径:通过新的音频信息表征形式Audio Layout,即极低分辨率的梅尔谱,来表示音频的粗粒度语义和时间信息。在一个无声视频中,可以先对其视觉语义进行编码并预测Audio Layout,然后利用语义编码和预测的Audio Layout作为条件信息,学习一个扩散模型生成音频。“各项客观和主观实验表明,我们的方法在生成质量、语义匹配和时间同步精度方面优于现有的SOTA方法。”宋睿华介绍。

  在TiVA、BSharedRAG、MuKA等整个创新框架研究的过程中,值得买科技为研究提供了必要的集群算力支持和高质量脱敏的数据支持;平台积攒的大量真实用户图文、视频等素材和全方位的用户行为,也帮助研究人员获取了真实的消费互联网验证场景。实验结果表明,TiVA在提高语义匹配和精确时间同步的同时,将生成速度加快了约40%。

  宋睿华在现场表示,合作的研究项目不仅在技术上取得了突破,更在学术研究和实际应用之间架起了一座桥梁。这离不开研究人员的专业和严谨,离不开值得买科技对学术研究的支持,相信这为学术界与产业界的合作树立了典范,“希望双方持续携手探索ai的新边界,为学术研究与创新应用带来更多价值”。

  作为技术驱动型公司,值得买科技始终坚持以先进技术提升供需两端的连接效率。值得买科技坚信,优质内容具有不可替代的价值,在消费领域,不仅体现在助力消费者高效决策,也能有效帮助品牌与平台建立用户认知与认可。为此,值得买科技始终坚持以内容为核心,以技术为驱动,而此次合作成果,正是以AI技术能力提升内容创作水平的有机结合。

  今年5月,值得买科技正式发布全面AI战略,不仅基于AI对现有业务、产品进行升级重塑,还利用AI重塑内容生产流程、不断提升内容生产能力和质量。在建设自身AI能力方面,值得买科技构建了由“1个大模型、2个数据库、3个引擎、4类应用”组成的AI产品矩阵;并将“什么值得买APP”升级为“AI原生的什么值得买GEN2”,打造成一个“基于用户的个性化兴趣,应用AI技术对全网消费内容进行搜集、分析、提炼、推荐的消费内容平台”,借助AI主动为用户提取和理解内容、商品、价格等消费信息,基于用户兴趣给到消费者真正的“答案”。而已上线的AI购物助手“小值”,能够在深度理解用户意图的基础上,总结全网实时消费经验与电商信息,提供口碑总结、商品对比、商品推荐、全网比价等服务。

  除了自身AI能力的持续提升,值得买科技还注重连接外部多领域合作伙伴,共建“AI+兴趣”双轮驱动的消费生态:在AI生态方面,与月之暗面、智谱华章、讯飞星火、MiniMax、腾讯云、百度云等通用大模型企业合作;在内容生态方面,与36氪、汽车之家、省广集团等进行合作;在产学研协同方面,与中国人民大学、南开大学、中欧国际工商学院、中央财经大学商学院等高校联合进行,共同探索AI创新协同新路径,近期与人大共同研究的两项AI创新成果也即将面世。

  未来,值得买科技将坚持全面AI战略,携手更广泛、更多领域的合作伙伴,共同探索AI在学术、技术、商业上的创新和应用,共同推动AI生态创新协同发展,为创造消费信息自由流动的美好世界做出贡献。

其他相关 RELEVANT MATERIAL
世界快资讯:能辉科技(301046)5月5日主力资金净卖出680.69万元

世界快资讯:能辉科技(301046)5月5日主力资金净卖出680.69万元

sansa2025 sansa2025
26
2025-08-04
(相关资料图) 截至2023年5月5日收盘,能辉科技(301046)报收于29.1元,下跌3.35%,换手率4.04%,成交量2.38万手,成交额6976.99万元。 5月5日的资金流向数据方面,主力资金净流出680.69万元,占总成交额...
世界速读:同济科技第二大股东拟对7项议案投反对票 今公开征集投票权

世界速读:同济科技第二大股东拟对7项议案投反对票 今公开征集投票权

sansa2025 sansa2025
27
2025-08-04
同济科技(SH600846,股价10.40元,市值64.98亿元)的股东争斗仍未平息。 同济科技6月6日晚间披露,其股东上海量鼎实业发展合伙企业(有限合伙)(以下简称“量鼎实业”)向上市公司董事会提交相关函件,量鼎实业作为征集人,就上市公司拟于6月28日召开的2022年年度股东大会审议的有关议案向全体股东征集投票权。 《每日经济新闻》记者注意到,量鼎实业表示自己将在股东大会上对《2022年度董事会工作报告》《2023年度投资计划》等7项议案投反对票。量鼎实业就这7项议案(含子议案)...
中公教育拟三年培训500万乡村农业人才

中公教育拟三年培训500万乡村农业人才

sansa2025 sansa2025
27
2025-08-04
(资料图片) 4月22日,中公教育(002607.SZ)宣布启动“未来乡村计划”,力争三年内培训500万乡村治理骨干和新型农业经营主体人才。贵州省黔南州罗甸县麻怀村、湖南省娄底市新化县油溪桥村、福建省宁德市福安市坦洋村、江苏省南通市通州区四港村与中公教育签署了战略合作,成为“未来乡村计划”的首...
什么是质数什么是合数奇数偶数(什么是质数什么是合数)

什么是质数什么是合数奇数偶数(什么是质数什么是合数)

sansa2025 sansa2025
22
2025-08-04
1、质数(prime number)又称素数,有无限个。 2、一个大于1的自然数,除了1和它本身外,不能被其他自然数整除,换句话说就是该数除了1和它本身以外不再有其他的因数;否则称为合数。 3、合数,数学用语,英文名为Composite number,指自然数中除了能被1和本身整除外,还能被其他的数整除(不包括0)的数。 ˂img style="display:block;margin:auto;" width="...
今日热闻!中国科研人员揭示早期地球海洋维持漫长缺氧原因

今日热闻!中国科研人员揭示早期地球海洋维持漫长缺氧原因

sansa2025 sansa2025
27
2025-08-04
(相关资料图) 中新社成都6月1日电 (记者 贺劭清)记者6月1日从成都理工大学获悉,该校沉积与生物地球化学国际研究中心李超教授研究团队利用能够直接追踪古海洋磷含量的碳酸盐结合态磷酸盐(简称CAP)技术,重建了地质关键期埃迪卡拉纪(距今约6.35亿年至...
变身美版“探探”搞暗恋 Facebook“约会”成“红娘”?

变身美版“探探”搞暗恋 Facebook“约会”成“红娘”?

sansa2025 sansa2025
29
2025-08-04
Facebook 最近推出一个具有影响力的功能,这可能会让社交网络更深入我们的个人生活。Facebook Dating是一个大胆的举措。˂/div...
评论 SAY SOMETHING
年度爆文
9
大米正酝酿涨价风暴? 多个国家或将提高出口价格
     今年以来,相比于前几个月一度疯涨的小麦来说,全球大米价格涨幅一直相对温和。但这一格局近期可能迎来转变。   继全球最大大米出口国印度近期开始对大米征收20%出口税后,全球第二大和第三大大米出口国越南和泰国也紧随其后,准备提高大米出口价格。   专家预测,在当前俄乌冲突持续还自己,越南和泰国此举可能导致食品价格进一步上涨,并加剧全球通货膨胀。   越泰打算提高大米出口价格   据《日经新闻》报道,泰国农业与合作部部长查棱猜将于10月初访问越南,与越南农业部长黎明欢就提高大米出口价格举行会谈。   越南和泰国可能将大米出口价格提高约20%   据泰国政府官员声称,查棱猜将于10月6日和7日访问越南。报道称,查棱猜将与黎明欢就两国农业合作,包括大米出口价格问题举行会谈。据称,。   今年9月初,泰国官员表示,两国已同意共同努力提高大米出口价格,并指出,由于化肥和化学品的价格飙升,该国农民目前无法承担更高的生产成本。两国将各自成立工作组研究具体措施。   据泰国当地媒体报道,在10月的会议上,越泰两国将讨论协议的细节,以制定下一步的实施步骤,并基于当前高生产成本的情况提高大米出口价格。   查棱猜此前曾表示:“新协议是泰国和越南利用全球市场定价机制帮助农民获得更合适的出口价格的第一步。”   为了实施该协议,泰国和越南下一步还将致力于建立一个谈判机制,同时努力说服更多的大米出口国加入该协议。   “将米价提高到适当水平,是大米生产国和出口国的义务和责任。气候变化正在影响全世界的水稻种植和水稻生产。”泰国农业部门顾问Alongkorn Ponlaboot表示。   大米价格近期已经开始上涨   自俄乌战争爆发以后,由于俄罗斯和乌克兰均为全球主要小麦出口国,小麦价格一度疯狂飙升。而大米价格相对于小麦价格一直相对稳定。   根据联合国粮农组织(FAO)此前公布的数据,今年8月,泰国大米出口价格同比上涨8.4%。越南大米价格同比涨1.4%。相比之下,美国小麦价格8月同比上涨18.3%,欧盟小麦价格同比涨15.9%,而阿根廷小麦价格涨幅更是惊人,达到43%。   然而,全球最大的大米出口国印度最近对某些种类的大米征收了20%的出口税,以确保本国供应。行业人士预计,印度此举可能令该国今年大米出口量下降25%   值得注意的是,在印度9月9日正式开始针对部分大米征收出口税后,越南的大米出口价格已经开始上涨。   根据美国农业部的数据,2021年,全球大米出口量达到516...
10
天天观焦点:豆瓣8.3分,“三悦”解不了B站的焦虑
  播出的第20天,《三悦有了新工作》终于迎来了自己的豆瓣开分——8.3。      (资料图片)   只是,尽管开分当日话题#三悦有了新工作豆瓣开分8.3#火速冲上了微博热搜,但该剧给B站带去的口碑胜利并没有冲破圈层。   截止发稿前,热搜#三悦有了新工作豆瓣开分8.3#阅读量不足7000万,剧集总话题#三悦有了新工作#阅读量仅3亿+,豆瓣评分人数也不过1万出头。与此同时,该剧目前的猫眼历史最高热度仅3425.19,远不及《风犬少年的天空》的二分之一,在站内播放量上更存在近5亿之差。   接下来,《三悦有了新工作》的热度与播放曲线能否在口碑的带动下低开高走,还存在很大未知,但可以确定的是,给它留下的逆袭时间不多了。   按照B站公布的追剧日历,该剧会在27号迎来会员收官。另一边,在此期间,剧集市场的观众注意力会随着《我们这十年》《摇滚狂花》等大剧的相继播出被进一步分流。   缓慢成长的自制内容   谁都不能否认,从《风犬少年的天空》到《三悦有了新工作》,B站自制剧集始终是在前进的。   2021年,凭借不世俗的国产女主形象构建、对共享的时代情绪和话题荒诞又出格的表达,B站主控推出的《突如其来的假期》收获了不少拥趸。紧随其后,B站联合出品并独播的《双镜》也凭借女作家&女杀手的创新双女主设定刷了一波存在感与关注度。   今年,在《三悦有了新工作》播出前,B站与欢娱影视二次牵手推出的古装美食剧《珍馐记》、与迪士尼联合出品的律政轻喜剧《正义的算法》,以及与暴走漫画联合出品的爆梗迷你喜剧《片场日记》也都曾让不少观众眼前一亮。   可惜的是,在推动B站破圈上步子慢了一点,也小了一点。   截止发稿前,《珍馐记》《双镜》《突如其来的假期》在B站站内的播放量分别为1.9亿、1.7亿、1.2亿,《片场日记》6000万出头,《正义的算法》仅过45万。   回看《三悦有了新工作》。   百度指数显示,《风犬少年的天空》的男性观众与女性观众占比相对均衡,而该剧的女性观众占比高达71.27%。根据B站2020年Q1用户画像显示,B站18-35岁用户占78%。用户男女比例为57:43。   同时火烧云数据也显示,从各大主流分区的UP主的抽样粉丝属性来看,男性粉丝居多。   也就是说《三悦有了新工作》的受众与B站受众的重合度并没有那么高,而这也是《珍馐记》《双镜》《突如其来的假期》站内播放量涨不动的一大主因。   其次,透过《三悦有了新工作》等B站自制剧集的题材与人群聚焦、故事表达以及风格呈现,我们可以明显感受到B站在创作上有意规避那些市面上已高度集中与下沉的题材,侧重在挥洒创意与描摹多元的基础上表达当下。   但任何事物都存在利与弊的双面性。   B站对内容创新的坚定给了平台自制无穷的未来想象力,也有效丰富了影视市场的剧作类型,可站在市场传播的角度上,B站放弃寻求受众情绪的最大公约数这一收视密码,注定会使得剧集无法对标到更多人,破圈也自然需要迈过更高的门槛。   幸运的是,从这些剧集的口碑表现看,大众普遍愿意给予耐心让B站自制去沉淀更大的成长,可矛盾之处在于,B站等不起了。   急切的盈利渴望   在B站2021年四季度和全年财报电话会议上,B站首席财务官樊欣曾公开明确了公司盈利的时间表:在2022年开始全年non-GAAP(非公认会计准则)运营亏损率同比收窄,中期目标于2024年实现non-GAAP盈亏平衡。   可现实的推进进度并不尽如人意。   财报披露,B站2022年Q1的净亏损同比扩大152%至22.84亿元,Q2净亏损同比扩大79.3%至20.10亿元,而平台给出的Q3业绩指引(56-58亿元)也低于市场预期。另一边,截至6月底,不计算贷款和可转债,B站账上现金+存款+短期投资一共249.2亿元。   这一背景下,即便《三悦有了新工作》能冲破圈层也缓解不了B站的焦虑。   事实上,以剧集、综艺为代表的长视频内容的投入产出比本身就不足够乐观,这样就不难理解为什么在“降本增效”成为长视频的一大发展共识后,“超前点播”又披着“大结局点映礼”的新马甲重新登场,平台的会员价格也是“涨声”不断。   B站深刻明白这个道理。   近日,B站一面升级了电脑端笔记功能的入口,一面在推广页以知识类、课程类视频为例详细介绍了B站笔记的使用攻略,同时也在通过平台检索推荐、提高曝光以及开放投币与“一键三连”功能等鼓励UP主给自己的视频写笔记评论。   结合哔哩哔哩副董事长兼COO李旎在Q2财报电话会上提到的“UP主的广告种草”,B站此时加码B站笔记有很大可能是想在图文种草赛道分一杯羹。  ...
12
天天热讯:眼镜镜片花了怎么清洗(眼镜镜片花了怎么修复)
  您好,现在渔夫来为大家解答以上的问题。眼镜镜片花了怎么清洗,眼镜镜片花了怎么修复相信很多小伙伴还不知道,现在让我们一起来看看吧!      (资料图片仅供参考)   1、方法一:用水磨砂布或纱布轻轻擦划痕,然后将擦毛了的地方涂上牙膏,用一块麂皮或类似东西慢慢擦,直至透明为止。   2、方法二:如果痕迹很小,可以用棉签沾酒精延划痕方向轻轻擦拭,这样可以遮盖划痕,或是对着镜片哈口气。   3、顺着一个方向擦。   4、方法三:可以用柔布涂抹少许牙膏在眼镜片有划痕的一面延同一个方向轻轻擦拭。   5、一方面牙膏有一定的打磨作用,其中含有平时用来打磨牙齿的打磨剂,现在也可用语打磨眼镜;另一方面牙膏也可对一些划痕起到填补作用。   6、方法四:如果自己担心处理不好,可以把眼镜拿到眼镜店去打磨,这样也可以去除眼镜片的花痕。   7、方法五:如果实在划痕太深只有到影碟店看是否可以用打磨影碟的打磨器打磨,再不行就只有换眼镜了,毕竟现在眼镜也还是比较便宜的。   8、如何防止眼镜镜片刮花 :眼镜脏了,千万别上来就擦大致可以将镜片脏了原因分为两类:一是油脂、汗迹或指纹等产生的:这种可以直接用干镜的眼镜布、湿巾进行擦拭清洁;二是粘染灰尘等产生的:要先用水洗的方式将镜面的灰尘颗粒冲洗掉,这种不可以直接用眼镜布、湿巾进行擦拭,否则非常容易产生擦纹,将镜面刮花。   9、尽量先用水洗,再清洁 。 ...