看视频、画CAD、运动想像识别！75B的多模态工业大模型太能干了-先锋网

今年的重点升级在于引入了多模态大模型能力，这个进阶的大模型能够处理包括文本、图片、视频在内的多种信息模态，甚至能够融合工业场景中特有的数据类型，比如CAD图纸和EEG信号。它的输出同样多样，能够生成文本、图像、视频、CAD设计图或者具体操作行为。

首先，让我们来看看ChatCAD这个工业“文生图”之美的应用。传统CAD软件市场一直被国外厂商把持，使用门槛高，设计工作大多依赖人工。但是，创新奇智率先将工业大模型技术引入工业设计领域，推出了Text-to-CAD类应用“ChatCAD”。通过简单的对话问答形式，设计师可以快速生成符合要求的工业设计图，并支持导出到传统软件进行微调。ChatCAD不仅可以处理简单的设计需求，还可以处理复杂的部件设计需求，大大提高了设计效率。

接下来是ChatVision，工业安全监管的新利器。基于AInno-75B工业大模型，ChatVision可以通过自然语言实时分析监控视频流、视频文件和图片，精准识别不合规行为，并立即触发报警系统，助力工业企业安全生产。ChatVision展现了其广阔的应用前景，可以应对各种具体目标识别任务，大大提高了工厂生产安全与合规的效率。