10月31日AI科技快讯
来源:米乐m6网页版登录入口 发布时间:2024-12-04 12:40:35 浏览量:21 次近来,爱诗科技隆重推出了其最新版别的多模态视频生成东西——PixVerse V3。此次晋级引入了一系列立异功用,包含构思模板、对口型、故事续写以及风格转化,旨在更精准地了解用户的提示词,生成赋有情感和质感的视频,以此来完成实际与虚拟的完美交融。值得一提的是,PixVerse V3不只支撑多种视频份额,还新增了对口型功用,能主动适配视频中人物的口型。此外,Efect功用供给了八种构思作用,支撑相似Pika的“捏”特效,进一步丰厚了用户的创造体会。
10月28日,苹果公司宣告其智能帮手——苹果智能(Apple Intelligence)正式在iPhone、iPad和Mac上上线。一起,苹果还发布了搭载M4芯片的全新iMac,起价格为1299美元,装备16GB内存,并将在11月8日开端出售。这一系列行动标明苹果在智能技术范畴的继续立异和对使用者实在的体会的注重。
MiniMax的AI使用Talkie在海外商场体现亮眼,估计年收入将打破7000万美元,成为公司的首要收入来历。自2023年6月上线以来,Talkie敏捷兴起,成为全世界陪同类AI使用下载量的前三名,招引了很多用户并完成了高付费率。虽然其国内版别“星野”未能仿制成功,MiniMax仍然方案拓宽东南亚商场,以应对收入来历单一的潜在危险。
近期,奥秘的文生图模型“red_panda”(小能猫)在网络上敏捷走红,其ELO得分超越Flux 1.1Pro,胜率高达79%,每7秒生成一张图画。该模型的实在来历没有承认,引发了广泛的猜想,或许来自我国厂商或Midjourney V7等。通过实测,red panda在各类竞赛中体现出色,虽然并非肯定成功,但其微弱的体现招引了很多重视。
5.微软开源OmniParser:让GPT-4V秒懂屏幕截图,可控制手机/电脑
微软公司宣告开源了一款名为OmniParser的东西,这款东西可以解析和辨认屏幕上的可交互图标。OmniParser不依赖额定的上下文数据,可以了解更杂乱的图形用户界面(GUI),标志着智能GUI主动化范畴的一项重大进展。该东西结合了可交互区域检测模型、图标描绘模型和OCR模块等,可以在桌面、移动电子设备和网页等多个渠道上高效作业,提高用户界面的了解准确性。