用计算机视觉改进产品
将AI应用于图像分类
使用小数据集的迁移学习
人脸识别
使用内容生成和风格迁移
AI在音频领域的应用
谷歌通过其MUM AI 系统采用类似的视频理解方法,该公司使用该系统根据音频、文本和视觉来挑选视频中的主题(例如,“丙烯画材料”),从而在 Google 搜索和 YouTube 上为视频推荐提供支持内容。但是,尽管这项技术可能具有可比性,但 Twelve Labs 是首批将其推向市场的供应商之一;谷歌选择将 MUM 保留在内部,拒绝通过面向公众的 API 提供它。
Twelve LabsTC
Twelve Labs 获得 1200 万美元用于理解视频上下文的 AI
目前处于封闭测试阶段的 Twelve Labs 使用 AI 尝试从视频中提取“丰富的信息”,例如运动和动作、物体和人物、声音、屏幕上的文本和语音,以识别它们之间的关系。该平台将这些不同的元素转换为称为“向量”的数学表示形式,并在帧之间形成“时间连接”,从而实现视频场景搜索等应用。

Reminiz这是一家法国计算机视觉初创公司,声称能够为任何类型的视频编制索引,并为录制的和直播的内容添加标签。但 Lee 断言,Twelve Labs 具有足够的差异化——部分原因是其平台允许客户针对特定类别的视频内容微调 AI。