大佬、巨子力挺,这家公司驶入AIGC一队伍
2023-06-15 

最近几个月来,好像每个人都在日常日子中跟ChatGPT、Bard等AI机器人聊得如火如荼,让它们来协助写邮件、写总结、做方案。但有个遍及的现象是,一旦当人们切换到作业形式时,这些生成式AI东西便很少出现在咱们的作业流程中,乃至被一些公司明令禁止。

AI才能如此强壮,为什么企业们不必?

这背面的中心原因其实很简略——每个企业的数据安全和隐私问题都太重要。没有企业敢把自己的“命脉”完完全全地交在还并未开展老练、并由其他大型公司掌控的AI手上。

那么,是否有方法处理这个扎手的问题,进而在企业端*化地开掘生成式AI的潜力呢?其实从2019年初步,就有一家名为Cohere的AI创业公司在亲近重视这个问题并不断提出处理方案。

长期以来,企业级的生成式AI都是一个相对小众且壁垒较高的商场,但Cohere凭借着老练的技能和敏锐的嗅觉得到了一众大佬和巨子的支撑。现在Cohere的出资者不只包含英伟达、甲骨文、Salesforce等巨子,一起还有图灵奖得主Geoffrey Hinton、斯坦福AI教授李飞飞等一众圈内大佬。不久前,YouTube 的前首席财政官 Martin Kon 也挑选参加 Cohere担任总裁和首席运营官。

英伟达、甲骨文和Salesforce都在押注Cohere,图片来自Crunchbase

乘着ChatGPT爆火的春风,今年以来,Cohere的潜力初步被越来越多的人的看到并进入了估值飙升的快车道,现在已成为全球AIGC赛道仅次于OpenAI和Antropic的第三大独角兽。

|从谷歌“脱胎”,来自加拿大*AI圈

Cohere建立于加拿大多伦多,于2019年由Aidan Gomez、Ivan Zhang和Nick Frosst一起创立。三人本科都就读于多伦多大学计算机科学专业,依照入学时刻计算,三人现在应该都未超越30岁。

Cohere的开创团队,图片来自Cohere官网

其间,Aidan Gomez在2017年本科期间就参加了由谷歌大脑团队研讨并作为署名者之一宣告了名为《Attention is All You Need》的论文,而这篇论文便是日后大名鼎鼎的Transformer机器学习架构的初步,也是开展谷歌BERT、OpenAI的GPT 等未来革新性架构的柱石。

在同一年,Aidan Gomez和同系的同学Ivan Zhang创立了一个非营利人工智能研讨社区For.ai,用以支撑和链接世界各地的人工智能独立研讨者。

本科毕业后,Aidan Gomez前往牛津大学攻读计算机科学的博士学位,一起也参加了由“深度学习之父”、图灵奖获得者Geoffrey Hinton领导的谷歌AI团队,依据Transformer架构进行进一步研讨。在谷歌大脑的Hinton团队之中,Aidan Gomez结识了一向从事机器学习和认知科学研讨的Nick Frosst。

在之后两年中,经过研讨的深化,咱们了解到Transformer可以扩展为功用超卓的大型神经网络,并在言语相关的使命上体现非常超卓。包含Aidan Gomez在内的一些Transformer论文编撰者们都初步考虑这背面所蕴藏的商业化时机,现在除了Llion Jones仍在谷歌作业,其他七位作者都纷繁“下海”创业。

其间,Aidan Comez则与Nick Frosst和Ivan Zhang一起创立了Cohere。跟谷歌、微软等实力雄厚公司去重金练习大模型不同,在2019年Cohere建立初步,他们就专心于企业用例,企图依据不同企业的专有数据去创立定制化的大言语模型。

|不靠云,要做企业定制生成式AI服务

简略来说,Cohere的方针是要成为各类开发人员的默许 NLP 东西包,让各类开发人员都可以运用大型神经网络和*进AI来处理任何言语相关问题,但却不依托于任何公共云,让模型能在私有云或本地布置中运转。

现在,Cohere的首要产品首要围绕着企业日常运营中的三个要害范畴:文本生成、文本分类和文本检索,简直覆盖了企业出产中一切跟文字有关的范畴。

文本生成部分首要有Summarize、Generate、Command Model三个产品。Summarize是一个由大型言语模型驱动的文本摘要生成器,能快速概述和总结文档的要害点,可以支撑输入10万个字符和文本格式选项。Generate则是一个内容生成器,可以为各种目生成共同的内容,比方电子邮件和产品描述等。

下面,再要点介绍一下Command Model。Command是Cohere推出的一个可以承受用户个性化指令练习的文本生成模型。也便是说,企业用户在将自己的数据和Command结合之后,就可以发生一个自己独有的言语模型,可以在企业的实践事务中当即发挥作用。

Command Model,图片来自Cohere

值得注意的是,作为一个只要520 亿个参数的模型,Command的准确性体现此前却超越了其他更大规划练习的模型,在不久前被斯坦福大学的言语模型全面评价(HELM)评为世界上最有才能的大型言语模型。

图片截自斯坦福大学的言语模型全面评价(HELM)官网

文本检索部分,包含Embed、Semantic Search、Rerank三个产品。

关于期望构建自己的文本剖析使用程序的机器学习团队,Embed可以协助他们快速发现趋势,并支撑100多种言语。Semantic Search是一个强壮的查找东西,用户只需求简略运用API,就可以运用该查找功用,可以支撑依据查询的意义而不只仅是要害词来回来多种信息,而且不受言语的约束。Rerank可以依据语义相关性剖析现有东西的查找成果并进行排名,然后供给更丰厚、更相关的成果,且对用户的干涉或编程经历要求很小。

文本分类部分首要产品为Classify,该功用运用户可以个性化的安排信息来协助内容审阅、用户剖析和进行谈天机器人体会。比方它可以经过快速符号不同类别的客户来进行高效的客户服务,也可以辨认正面和负面的交际媒体谈论来更好地了解客户的反应等。

图片来自Cohere

Cohere 的商业形式是先承当创立大型的Transformer神经网络的本钱,然后再将有需求公司连接到这些网络,公司则按运用状况进行付费。Cohere的首要特点是为客户供给了包含私有云、本地布置、Cohere保管云和其他云同伴AWS、谷歌等多种数据保管选项,让用户依据本身需求进行挑选,让客户对数据具有控制权。

关于期望学习原型规划并成为社区一部分的开发者,Cohere供给了免费的、约束运用率的运用。但是,假如期望进入出产、练习自定义模型、拜访一切端点并接纳增强的客户支撑,将需求付出费用。现在Cohere的客户包含Spotify、Jasper、HyperWrite等。

从价格来看,嵌入功用下,默许模型每 100 万个Token 40 美分,企业自定义的模型80 美分,生成功用下,默许模型每 100 万个Token 15 美元,自定义模型30 美元,总结功用下,每100万个Token15美元等。

Cohere不同功用的价格状况,图片来自Cohere

不过,此前Cohere的这个定价还算很有优势,但在昨日OpenAI大降价之后,估计也会给Cohere带来不小的冲击。比方OpenAI的嵌入模型价格直接跳水75%,每千token只需0.0001美金,也便是1美元一千万token,远远低于Cohere。

|大佬和巨子力挺,Cohere驶入AIGC*阵营

瞄准企业级AI数据安全痛点的Cohere,在其时的AI用户端厮杀中锋芒毕露,包含VC、科技巨子和人工智能范畴的大佬们都给它投去了支撑票。2021年正式迈入商业化以来,Cohere的估值也节节攀升,现在已到达约22亿美元,在AIGC赛道仅次于微软支撑的OpenAI和谷歌支撑的Anthropic

在Cohere建立之初,它的人工智能学术颜色好像更为浓郁。在2021年和2022年的Cohere A轮和B轮融资中,其时的AIGC赛道的出资还在隆冬中,有谁给Cohere投去了支撑资金呢?在这两轮的出资列表中,咱们都看到了以下几位AI大佬的身影。

图片来自Crunchbase

除了几个开创人在多伦多直接跟从学习过的“深度学习之父”、图灵奖得主Geoffrey Hinton之外,还包含斯坦福大学教授、视觉试验室负责人李飞飞,加州大学伯克利分校教授、伯克利人工智能试验室主任Pieter Abbeel,多伦多大学教授、前Uber人驾驭轿车技能研讨中心主任Raquel Urtasun,个个都是人工智能范畴的学术大咖。

而在本月初宣告的最新一轮融资中,在AIGC的热潮中,Cohere也得到了更多范畴内科技公司的重视。其间包含人工智能最强“军火商”英伟达以及云巨子Salesforce和甲骨文。现在的融资总额现已到达4.39亿美元。

Cohere的迅速开展离不开深沉的技能布景和赛道挑选。从大模型的视点来说,Cohere 现在或许并不是商场上最*的,但他们敏锐地抓到了AIGC企业端使用的痛点,可以在首要满意企业安全性需求的前提下,再进一步的供给内容生成、摘要、查找等范畴的服务。

他们的商业形式使得很多公司可以在无需斥重金构建自己模型的状况下自定义地接入大型神经网络,并经过细分事务模块,让公司能依据运用状况来进行付费,然后到达一种双赢的状况。

从现在Cohere 越来越高的热度和OpenAI最近大规划的降价和API晋级来看,AIGC的烽火在用户端正在一路蔓延到企业战场。而到时,或许一场真实的AI出产力革新才会真实初步。

新华期货,为每一笔交易提供可靠保障!