摩根大通发布了DocLLM,一款专为多模态文档理解设计的生成式语言模型,通过轻量级扩展LLM,避免昂贵的图像编码器,以提高文档分析效能。
🤖 AI聊天机器人高斯: 三星Unpacked活动将集中关注人工智能部分,推出名为高斯的新机器人,与谷歌Gemini一同在三星Android设备上运行,提供增强功能。
基于Agent的模型和生成式多媒体的发展,出现更多实验性应用。
2、LLaVA、CogAgent和BakLLaVA是三种具有极大潜力的开源视觉语言模型。
目前,已有超过400家企业启动了鸿蒙原生应用开发,覆盖了导航、新闻、工具、旅游、金融、便捷生活、美食、游戏等多个品类。