斯坦福玉人博士创业项目爆火,半年融资5500万美
2023-11-29 

斯坦福华人博士休学搞创业,直接火爆AI圈!

新产物瞄准AI视频天生,刚出道就成行业顶流,引来一众大佬围观评价。

OpenAI大牛Andrej Karpathy转发,并激情附上长文一段:

每小我私人都能成为多模态梦乡的导演,就像《盗梦空间》里的筑梦师一样。

就连Stability AI首创人也来点赞

这个新产物名为Pika1.0,背后公司Pika于今年4月确立。

要知道,这一行的产物已有不少,如确立5年的Runway等公司。

在AI视频天生“乱花迷人眼”的当下,这个新产物事实是若何做到迅速破圈,吸引大量关注度的?

从放出的Demo效果来看,Pika 1.0不仅能凭证文字图片,流通地天生一段视频,消息转换就在一瞬间:

而且可编辑性还稀奇强,指定视频中的随便元素,一句话就能实现快速“换装”:

这样的效果,也使得公司确立仅半年,产物用户已经跨越52万人。

更是新斩获5500万美元融资,其中小我私人投资者不乏种种大牛,如Quara首创人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。

以是,Pika事实有没有看起来这么好用?我们也马上上手体验了一番。

1、AI视频新顶流长啥样?

此次火爆出圈的Pika 1.0,是Pika宣布的*个正式版本产物。

经由四个多月Discord社区的测试,Pika以为是时刻推出本次重大升级了。

相比之前Pika还只能用文字或图像天生视频,现在的Pika 1.0,功效要加倍厚实——

不仅能凭证文字、图片或视频气概天生视频,还能对视频局部举行编辑

可编辑性有多强?

不仅画面巨细随便扩展,从5:2、1:1画布,到9:16以及16:9的超大屏,4种选择无缝转换:

像什么3D、动漫、影戏等林林总总的气概滤镜,那就更不用说了。

最主要的是,1.0正式版推出了用户更友好的网页版,不用在discord中一遍遍艾特机械人,就能直接上手玩。

固然,也可以移步Discord社区先上手体验一番。

只管它还未随网页版更新到Pika 1.0,但我们也实测了一下文字、图片天生视频的效果,还不错。

加入社区之后,直奔“Creations”,从下面的10个天生区随便选择一个进入即可开耍。

在输入框中输出“/”,选择最简朴的“/create”下令:

在此,我们输入“a robot dancing in the rain, sunset, 4k, -gs 8”提醒词交给机械人。

也许也就半分钟的时刻,视频就出来了,速率相当快:

‍效果嘛,雨没有显示得很显著,但机械人的肢体动态性真的很强。

我们再来一个稍微长一些的提醒词:

a teenager walks through the city streets,takes pictures of places(一个青少年穿过都会的街道,拍摄照片)

仍然超级快,效果就出来了:

Wow,这次真的有很知足,画面相符脑海中的展望,甚至比我们想象得还要好

除了纯文字,咱还可以上传一张参考图像举行创作,使用“/animate”下令。

当当,一张静态神色包就动起来了:

总的来看,Pika给出的视频时长都是3s(以是使用太长的提醒词也没用,后面会直接忽略掉),以及它还不能保证每次效果都很知足,但总体来说多试几回照样有不错的效果泛起的。

在自测之外,我们也来看看网友的作品,其中不乏异常惊艳的效果。

好比有人创作的这只小怪兽,憨态可掬,让人忍不住想摸一把:

另有这段两位小女孩的演奏画面,看完我似乎真的听到了优美的嗓音从中传出:

英伟达高薪抢夺中国自动驾驶人才

最绝的照样这个白鸽围绕短发玉人翻飞的排场:

也太有气氛感了吧~

看罢如上效果,我们也来盘盘这家公司事实是什么来头。

2、两位斯坦福华人博士确立

Pika的首创人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

据The Information新闻,郭文景于今年四月确立了Pika,随后Chenlin Meng加入成为联创,两人互助开发了这个文本天生视频模子。

从二人学术经向来看,她们划分专注于NLP和盘算机视觉两个偏向的AI研究,也都有天生式AI的学术履历。

团结首创人兼CEO郭文景,斯坦福大学AI实验室(NLP&图形学偏向)博士。

她在美国出生,杭州长大初中就读的是杭州外国语学校,从小就接触编程,夺得过IOI银牌,从本科最先正式留学,被哈佛大学提前录取。

此次创业,她的领英主页显示休学中(On Leave),应该是设计先忙创业的事情。

在斯坦佛大学读博之前,郭文景在哈佛大学取得了盘算机硕士和数学本科学位。

在本科时代,她曾经gap过一年,专程在Facebook AI Research全职做了一段时间的研究工程师。

在职时代,她介入了用Transformer剖析2.5亿个卵白质序列的研究,现在这篇论文引用已有1200 ,其中就包罗厥后大火的AlphaFold2

除此之外,她也先后在Epic Games、谷歌和微软等多家公司实习过。

这次创业,郭文景的导师Christopher D Manning也给予了不少支持。

Christopher D Manning以NLP偏向的研究著名,现在在谷歌学术上的引用量已有23w ,而他也将成为Pika的学术照料之一。

团结首创人兼CTO Chenlin Meng,同样是斯坦福盘算机博士。

在此之前,她于2020年在斯坦福大学获得了数学本科学位。

相比郭文景在NLP领域的研究履历,她在盘算机视觉、3D视觉方面的学术履历加倍厚实,介入的去噪扩散隐式模子(DDIM)论文,现在单篇引用已有1700 :

除此之外,她另有多篇天生式AI相关研究揭晓在ICLR、NeurIPS、CVPR、ICML等顶会上,且多篇入选Oral。

固然,随着Pika 1.0爆火,Pika也开启了进一步的招人设计,从手艺、产物到运营都有需求:

3、一个月内5家产物亮相

值得一提的是,不止是正在快速扩张的Pika。

就AI视频这个行业而言,这段时间来整体都迎来了一段“发作期”。

据不完全统计,从11月至今,短短一个月的时间就已经有5家AI视频天生产物宣布或迎来大更新:

首先就是11月3日,Runway的Gen-2宣布里程碑式更新,支持4K超真切的清晰度作品。

然后时间来到11月16日,Meta宣布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手,效果be like:

从Emu最先,人人都似乎打起竞赛来了,那叫一个争先恐后。

才过两天,11月18日,字节就半路杀出宣布PixelDance,作品的动态性可谓史无前者,画面中的元素都动作幅度都相当大,且稳固形,让人眼前一亮。

又仅过3天之后,11月21日,AIGC领域的佼佼者Stable AI也终于推出了自家的视频工具:Stable Video Diffusion。

效果嘛,也很能打。

统一天,Gen-2又没闲着,“横插一脚”上线“涂哪动哪”的运动笔刷新功效,直接标志出天生模子可控性上的一个主要里程碑。

最后,就是今天了,11月29日,来自创业公司的Pika直接带着网页版宣布正式版1.0,叫板“暮年迈”Runway

在此之外,我们还从未见过哪个阶段有这么多各有特色、来自差异靠山的产物争相亮相。

这也让人不得不叹息一句:

AI视频这是来到发作前夜了?

新华期货,为每一笔交易提供安全保障!