【AI日报·1/9】中文文字视频生成,AI视频爆发发展

“锵锵!这里是心猿社滴杂务工之‘工具酱’!每日十分钟,最全的AI大事,全知道!”

“别开场了,省流日报,你每多说一个字,就浪费了心猿社辣么多用户整整二字节的流量!”

“嘿!到我这改了还?”

“导播导播,直接开场!”


技术突破(性能&易用性)

通义万相发布2.1视频模型,实现中文文字视频生成,提升复杂运动生成能力【AI视频·性能突破】

2025年1月9日,阿里云通义万相推出2.1版本视频生成模型,在复杂运动、物理规律遵循和艺术表现等方面全面提升。该模型在权威评测集VBench中以84.7%的总分登顶,超越国内外主流视频生成模型。通义万相2.1采用自研的VAE和DiT架构,支持无限长1080P视频的高效编解码,并首次实现中文文字视频生成功能。该模型已全面开放,用户可通过官网免费使用或调用API。

相关资讯:http://www.zj.xinhuanet.com/20250109/bc0e8da5fac544769ca43dab69ae8adf/c.html

通义万相官网:https://tongyi.aliyun.com/wanxiang/videoCreation

Adobe TransPixar技术革新透明效果融入场景【AI视频·性能突破】

Adobe与香港科技大学联合开发的TransPixar技术,是一项创新的人工智能系统,它能够生成包含透明度(Alpha通道)的视觉效果,使得烟雾、反射等透明元素能够自然地融入场景中。这项技术突破了传统AI工具在处理透明元素方面的局限,通过扩展现有的视频AI模型,实现了在有限训练数据下生成高质量的RGBA视频。TransPixar不仅提高了视觉特效制作的效率,还降低了制作成本,为娱乐、广告和游戏行业提供了全新的创作可能性。此外,TransPixar的代码已在GitHub上开源,开发者可以通过Hugging Face上的演示进行试验和应用。

相关视频:https://www.bilibili.com/video/BV1DzrqYKEdD/?vd_source=bc854d3fd8ee05b37a17936972ac71c7

项目地址:https://github.com/wileewang/TransPixar

字节跳动联合高校推出STAR模型,提升视频清晰度【AI视频·性能突破】

南京大学、字节跳动和西南大学联合推出了STAR模型,这是一种创新的视频超分辨率(VSR)框架,能够将低分辨率视频提升为高分辨率,同时保持细节清晰度和时间一致性。STAR结合了文本到视频(T2V)扩散模型,增强了视频的空间细节和时间建模能力,并引入了局部信息增强模块(LIEM)和动态频率(DF)损失,以减轻伪影问题并提高恢复保真度。该技术适用于影视制作、安防监控、医疗影像处理等多个领域。

相关视频:https://www.bilibili.com/video/BV1cjrvY5E4d/

项目官网(需魔法才能通畅):https://nju-pcalab.github.io/projects/STAR/?utm_source=ai-bot.cn

项目地址:https://github.com/NJU-PCALab/STAR

种子视频修复技术SeedVR,模糊变高清【AI视频·性能突破】

南洋理工大学与字节跳动的研究团队推出了SeedVR技术,这是一种基于扩散变换器(Diffusion Transformer)的创新视频修复技术。SeedVR利用移动窗口注意力机制,能够处理任意长度和分辨率的视频,显著提升了高分辨率视频的恢复质量。该技术在AI生成视频的修复中表现尤为突出,能够有效修复模糊、噪声等问题,并生成具有真实感的细节。SeedVR结合了因果视频自编码器和多阶段渐进式训练策略,在多个基准测试中展现了卓越的性能。

相关资讯:https://www.chinaz.com/ainews/14578.shtml

项目地址:https://iceclear.github.io/projects/seedvr/

Stability AI推出SPAR3D,快速生成3D对象【AI绘画·性能突破】

Stability AI在CES 2025上发布了SPAR3D(Stable Point Aware 3D),这是一种两阶段3D生成方法,能够在不到一秒的时间内从单个图像生成3D对象,并支持实时编辑。SPAR3D通过点扩散模型生成稀疏点云,再结合输入图像生成高细节网格,提供了精确的几何形状和完整的360度视图预测。该技术适用于游戏开发、产品设计和环境构建等领域,显著提升了3D建模的效率和质量。

相关资讯:https://www.jiqizhixin.com/articles/2025-01-09-15

Stability AI官网:https://stability.ai/news/stable-point-aware-3d

英伟达Isaac GR00T技术助力人形机器人开发【人形机器人·性能突破】

NVIDIA在CES 2025上发布了Isaac GR00T技术,旨在加速人形机器人的开发。该技术通过合成运动生成和模仿学习,帮助机器人从人类示范中获取新技能。GR00T结合了NVIDIA的AI计算平台、仿真工具(如Isaac Sim)和高性能硬件(如Jetson Thor),为机器人开发者提供了强大的工具链。该技术已在多个机器人公司中应用,推动了人形机器人在工业和制造业中的发展。

相关资讯:https://blogs.nvidia.cn/blog/isaac-gr00t-blueprint-humanoid-robotics/

英伟达 GR00T介绍:https://developer.nvidia.cn/isaac/gr00t


AI重要事件&报道

2024胡润中国AI企业50强榜单发布

2025年1月9日,胡润研究院发布《2024胡润中国人工智能企业50强》,榜单聚焦于专注于AI算力或算法的中国企业,上榜门槛为价值60亿元人民币。寒武纪以2380亿元的价值位居榜首,科大讯飞和商汤科技分列第二、第三。北京以20家上榜企业领先,上海、深圳、广州紧随其后,一线城市企业占据榜单总数的80%以上。榜单还显示,生成式AI公司在2024年获得大量融资,如月之暗面、MiniMax等。

相关资讯:https://field.10jqka.com.cn/20250109/c665327582.shtml

巨量引擎AIGC工具“即创”正式上线

巨量引擎旗下的AIGC工具“即创”于2025年1月9日正式上线。该工具支持AI脚本生成、智能成片、数字人等多种内容生成方式,并新增了“爆款裂变”和“一键过审”功能,帮助创作者快速响应市场变化并提升内容合规性。“即创”通过深度学习和自然语言处理技术,能够根据用户输入的主题实时生成高质量的文本和视频内容,显著提升了创作效率。其智能成片技术可一键将脚本转化为视频,并生成数字人以增强互动性。

相关资讯:https://www.qewen.com/6555.html

生成式人工智能服务在国家网信办备案数量达238款

截至2024年12月31日,国家互联网信息办公室共完成302款生成式人工智能服务的备案,其中2024年新增238款。备案工作依据《生成式人工智能服务管理暂行办法》开展,旨在规范市场并提升服务的安全性和透明度。已备案的服务需在产品显著位置公示模型名称、备案号等信息,以确保用户知情权。

相关资讯:https://www.cac.gov.cn/2025-01/08/c_1738034725920930.htm


AI发烧友&Github资讯

适合开发者/程序员等喜欢探索AI的用户哦~

微软Phi-4小模型开源,性能优异

微软于2025年1月8日在Hugging Face平台上开源了小型语言模型Phi-4,该模型参数量仅为140亿,但在多项基准测试中表现优异,超越了OpenAI的GPT-4o、Llama-3.1等知名模型。Phi-4在数学竞赛AMC中获得了91.8分,并在MMLU测试中取得84.8分,展现了强大的推理能力。其成功得益于创新的合成数据生成方法、高效的预训练机制以及对消费级硬件的适配性。Phi-4的开源吸引了大量开发者和AI爱好者的关注,并支持商业用途。

相关资讯:https://www.chinaz.com/ainews/14576.shtml

项目地址(需魔法才能通畅):https://huggingface.co/microsoft/phi-4


鉴定网络热门AI事件(陪我一起看资讯吧~)

工程师用ChatGPT制作机器人步枪,OpenAI迅速回应

一位名为STS 3D的工程师开发了一款由ChatGPT控制的机器人步枪,能够根据语音指令瞄准并射击。该发明引发了广泛争议,OpenAI迅速回应称其违反了公司禁止将技术用于武器开发的政策,并已切断该工程师的API访问权限。这一事件凸显了AI技术在武器化应用中的伦理风险。

相关资讯:https://futurism.com/openai-powered-sentry-rifle

微软因用户投诉回滚Bing AI图像生成器升级

微软在2024年12月将Bing图像生成器升级至DALL-E 3 PR16版本后,用户普遍反映图像质量下降,包括细节丢失、人物图像不自然等问题。由于用户投诉,微软决定回滚至旧版PR13模型,预计需要2-3周完成全部用户的回滚操作。

相关资讯:https://www.ithome.com/0/823/477.htm

工具酱心选文章:

THE END
喜欢作者就支持一下吧~
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情图片快捷回复

    暂无评论内容