看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了

科技动态 2024-03-28 16:00 阅读:26

今年的重点升级在于引入了多模态大模型能力,这个进阶的大模型能够处理包括文本、图片、视频在内的多种信息模态,甚至能够融合工业场景中特有的数据类型,比如CAD图纸和EEG信号。它的输出同样多样,能够生成文本、图像、视频、CAD设计图或者具体操作行为。

首先,让我们来看看ChatCAD这个工业“文生图”之美的应用。传统CAD软件市场一直被国外厂商把持,使用门槛高,设计工作大多依赖人工。但是,创新奇智率先将工业大模型技术引入工业设计领域,推出了Text-to-CAD类应用“ChatCAD”。通过简单的对话问答形式,设计师可以快速生成符合要求的工业设计图,并支持导出到传统软件进行微调。ChatCAD不仅可以处理简单的设计需求,还可以处理复杂的部件设计需求,大大提高了设计效率。

接下来是ChatVision,工业安全监管的新利器。基于AInno-75B工业大模型,ChatVision可以通过自然语言实时分析监控视频流、视频文件和图片,精准识别不合规行为,并立即触发报警系统,助力工业企业安全生产。ChatVision展现了其广阔的应用前景,可以应对各种具体目标识别任务,大大提高了工厂生产安全与合规的效率。

最后是ChatRobot Pro,实现了“运动想像识别”。ChatRobot Pro可以处理更复杂的信息载体脑电信号,实现了语音控制工业机器人。通过运动想像控制工业机器人完成任务,大大提高了工业自动化的效率。创新奇智在这方面的研发工作,为未来可能的脑控工业自动化场景进行了技术预研。

创新奇智的工业大模型在企业服务方向上展现出了巨大的潜力。这些原生应用的不断升级和完善,将为工业领域带来更多的便利和效率提升。创新奇智将继续努力,不断进化,为工业智能化发展贡献力量。