7月2日,《每日经济新闻》记者获悉 ,百度商业研发团队对外发布了自研视频生成模型“MuseSteamer”及配套创作平台“绘想 ”,正式进军AI(人工智能)视频生成领域。
2024年,Sora爆火引发生成式视频大模型热潮 ,李彦宏则在一场内部讲话中称,Sora这种视频生成模型的投入周期太长,10年、20年都可能拿不到业务收益 ,无论多火爆,百度都不去做 。
7月2日,一位接近百度的人士对《每日经济新闻》记者分析称 ,Robin(李彦宏)点评Sora其实还有后半句,基于多模态需求,可以做一个相对特定的视频生成场景。“包括百度前段时间的罗永浩数字人其实也是特定场景的视频生成。原本商业侧已有擎舵这个平台,那么去服务B端商业客户生成AIGC(人工智能生成内容)产品宣传视频 ,其实就是特定场景,也是有用户需求的 。”
关键优势在于极致遵循力
当前,AI生成视频在生成质量 、画面稳定性和长度等方面仍是各大技术厂商持续攻坚的领域。
百度商业体系商业研发总经理刘林表示 ,在数字内容创作领域,视频时长与画质的突破往往意味着创作自由度的质变。MuseSteamer可支持电影级审美下的10秒长视频的生成,1080P的高清晰度 ,为视频创作提供了更大的表现空间 。
刘林表示,传统AIGC视频创作实践中,往往是先生成视频 ,再进行配音和添加音效。割裂的创作环节不仅消耗大量时间,更会削弱作品的完整艺术表达。MuseSteamer创新性支持一体化生成带有音效和人物台词的视频 。
此外,在视频长度方面 ,MuseSteamer目前支持生成5秒和10秒两个版本,并可达1080p清晰度。百度此次同步发布了MuseSteamer模型的家族版本,包括Turbo、Lite、Pro,以及各版本对应的有声版 ,分别面向不同的创作需求和成本考量。
刘林强调,MuseSteamer的关键优势在于其对创作指令的理解与执行能力,即所谓的极致遵循力 ,能实现创作者“所思即所得”的表达自由。此外,镜头运用能力也是其差异化竞争力之一,百度希望通过该模型降低专业创作门槛 ,让更多人获得“镜头平权 ” 。
据介绍,MuseSteamer模型的技术基础包括三大方面:首先,在数据准备阶段 ,通过“筛选—净化—配比”的方式,对超过10亿条异构数据进行处理,并结合三级标签体系和Active Learning(主动学习)机制 ,以保证训练数据的审美和结构质量。
其次,在模型训练过程中,采用多目标反馈的强化学习优化路径,试图在保证视频动作幅度的同时 ,保持主体内容的一致性稳定输出。同时,MuseSteamer引入美学条件控制调优,通过隐式批判学习和影视标准严选 ,让模型懂美 、创造美 。
MuseSteamer如何面对劲敌
相比OpenAI、字节跳动、Pika等更早投入文生视频赛道的企业,百度此次推出MuseSteamer确属“后发”。无论是国外如Pika 、Runway,还是国内如快手旗下的可灵AI、字节跳动旗下剪映团队孵化的AI创作平台即梦AI ,均从2024年起就密集发布各类模型、功能和平台,并已完成多次迭代。
今年5月,快手可灵AI宣布推出全新2.1系列模型 ,高品质模式(1080p)下生成5秒视频仅需不到1分钟 。快手官网信息显示,可灵AI在推出10个月之后(即今年3月)的年化收入运行率(Annualized Revenue Run Rate)突破1亿美金,其今年4月和5月的月度付费金额均超过1亿元人民币。
百度是最早布局大模型的国内科技企业之一。自2023年起 ,百度发布文心一言 、迭代多个版本的文心大模型,同时已在搜索、地图、文档、企业服务等多个业务线中落地大模型能力 。
但在视频生成这一AIGC下一个爆发点上,百度此前并未公开大动作,仅在2024年宣布领投清华系视频大模型公司生数科技。此外 ,2025年3月,百度发布的文心大模型4.5和4.5 Turbo实现了文本 、图像和视频的混合训练。
2024年,Sora爆火引发国内生成式视频大模型热潮 ,李彦宏则在一场内部讲话中称,Sora这种视频生成模型的投入周期太长,10年、20年都可能拿不到业务收益 ,无论多火爆,百度都不去做 。
7月2日,一位接近百度的人士对《每日经济新闻》记者分析称:“之前提到的不做类似Sora ,更多是不去训一个general-purpose(通用)的视频生成模型,但是在特定场景、特定目的下的视频生成能力是需要的,或者说基于对市场需求的判断 ,外界确实没有这种能力,会自己来生产 、研发这样的能力。 ”
上述人士表示,Robin(指李彦宏)点评Sora其实还有后半句,基于多模态需求 ,可以做一个相对特定的视频生成场景。“包括百度前段时间的罗永浩数字人其实也是特定场景的视频生成。原本商业侧已有擎舵这个平台,那么去服务B端商业客户生成AIGC产品宣传视频,其实就是特定场景 ,也是有用户需求的 。”
记者注意到,MuseSteamer由百度商业研发团队主导推出,或许意味着其背后的直接应用场景有可能是广告创意生成与内容投放。
此外 ,7月2日,百度搜索还宣布进行十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新。具体而言 ,百度搜索框升级为“智能框”,支持超千字的文本输入,拍照、语音 、视频等能力也全面加强 ,支持直接调取AI写作、AI作图等工具 。 百度搜索还宣布接入视频生成模型MuseSteamer。
未来,MuseSteamer如何融入百度搜索、营销与智能助手等核心业务,将决定它是否能从工具演化为平台,从模型能力走向商业杠杆。
(文章来源:每日经济新闻)
手机怎么开户股票开户流程:配资炒股入门教程视频配资-蓝佛安:健全横向生态保护补偿机制 加快“绿水青山”向“金山银山”转化
买卖股票开户及交易流程:配资炒股股-美国加征钢铁关税对我国钢铁行业影响几何?
股票开户微信公众号:什么叫用杠杆炒股-7月2日涨停复盘:63只股涨停 诚邦股份5连板
股票网上开户怎么开:股票好论坛-被判赔偿40万元、道歉30天 “红内裤”事件博主发视频向胖东来道歉:服从法院判决 胖东来是许昌的骄傲
网上办理股票开户:炒股创业板股票开户流程-特朗普发布“奥巴马被逮捕”AI视频 配文:没人能凌驾于法律之上!
肇庆股票配资网:股票开户怎么办理网上交易-DeepSeek官宣!新模型、新突破、新价格
线上股票开户选哪个券商好:股票账户在哪里开户好-突爆大消息!下一任美联储主席人选 谁的胜算最大?
股票:配资公司排名恒盛策略a怎么开户-暂停对等关税90天,港股高开高走,港股通科技ETF(513860)强势上涨5.44%
启泰网配资-最全面的配资平台_配资炒股公司_炒股杠杆平台收益提示:文章来自网络,不代表本站观点。
启泰网配资-最全面的配资平台_配资炒股公司_炒股杠杆平台收益⑯我们注重用户体验的持续提升,不断优化界面设计,提升平台的易用性和便捷性。
界面新闻记者|陈靖金融市场充满变数。年初至今,券商研究所分析师“转会”频频。过去三个月,券业并购下的...
消息面上,当地时间4月11日深夜,美国海关与边境保护局发布公告称,根据美国总统当天签署的备忘录,智能手机、路由器以及部分...
通过内容化表达,天猫服饰让直播间升级为承载品牌故事及理念的“数字枢纽”。传统秀场的物理边界正在逐步消解,把秀场直...
新开源在互动平台表示,美国业务约占3%-5%,目前关税对业务影响较小。...
记者辛圆为抵御外部冲击,商务部正在采取行动。商务部新闻发言人何咏前在周四的例行新闻发布会上表示...
记者辛圆据央视新闻周四发布消息,中国中小企业协会周四发布数据显示,2025年一季度,中国中小企业发展指...
苹果公司表示,即将面向开发者推出苹果智能模型;确认操作系统即将重新设计。 今年Apple智能将支持更多语言,同时苹...
记者从商务部了解到,截至目前,今年消费品以旧换新销售额已突破1万亿元。 今年以来,消费品以旧换新有力带动消费持续回...
作者:ACE1.对于中国的互联网大亨来说,刚刚过去的2021年,是被载入史册的一年。只不过,载入...
截至2025年4月11日 10:03,中证机器人指数(H30590)上涨0.23%,成分股中大力德(002896)上涨6...
布伦特原油自2021年2月以来首次跌破60美元,日内大跌近5%,现报59.8美元/桶。WTI原油期货跌幅扩大至5%,报5...
近期,多家汽车企业发起新一轮大范围降价。无序“价格战”等内卷式竞争,已成为汽车行业效益下降的重要因素。 中国汽车工...
【科创综指ETF鹏华(589680)份额再创新高,一键分享科创板成长红利】截至2025年4月11日 10:11,上证科创...
今日A股V型反弹,TMT行业探底回升。芯片50ETF(516920)探底回升,尾盘翻红收涨0.92%,资金连续涌入,近2...
3月25日消息,离岸人民币(CNH)兑美元北京时间04:59报7.2639元,较上周五纽约尾盘跌68点,日内整体交投于7...