云太医李伯群教授:打破地域壁垒,“互联网+中医”守护女性健康
云太医李伯群教授:打破地域壁垒,“互联网+中医”守护女性健康
云太医李伯群教授:打破地域壁垒,“互联网+中医”守护女性健康2025年6月6日(rì)-7日,第7届北京智源大会将以线上+线下联动的形式召开,6日下午推出“大模型产业CEO”主题论坛,邀请业内知名专家学者(zhuānjiāxuézhě)、大模型领域领军(lǐngjūn)企业CEO。
爱诗科技CEO王长虎发表(fābiǎo)了主题演讲——“PixVerse(拍我AI)如何打造一个受人喜爱的(de)产品”,他介绍了PixVerse的发展历程,以及(yǐjí)影响其发展的三个关键决策。
我们(wǒmen)的认知是视频是最贴近用户的内容(nèiróng)形态,视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。
Sora出现让视频(shìpín)从一个非(fēi)共识的状态,变成了一个非常热门的方向;
ChatGPT出现后,很多人认为在大语言模型领域,中国落后美国很多。但因为(yīnwèi)ChatGPT太火了,这种认知(rènzhī)被扩大到了整个AI领域,好像中国全面落后于(yú)美国。但实际上,过去几年我们在抖音(dǒuyīn)和TikTok上做的工作,以及我们团队在视频AI能力方面是领先(lǐngxiān)全球的。
从全力投入视频生成的那一刻起,我们的愿景就是帮助每一个(yígè)人成为生活的导演。有了(le)这个目标,后续的方向就很清晰了:我们要做好两件事情,一是如何(rúhé)降低普通人的创作门槛,二是如何提升(tíshēng)普通人的创作体验。
我们(wǒmen)决定(juédìng)先做ToC,再做ToB。我们认为我们是一个全球化团队,伴随(bànsuí)着(zhe)抖音和TikTok的发展,我们积累了全球化的经验和资源。在有限的资源下,我们优先选择海外市场,然后再拓展国内市场。
好的模型带来(dàilái)了(le)好的产品,有了这个认知之后,我们要做得更好,我们要做更好的模型。
企业是有生命的,就像一个小孩,你的孩子(háizi)。创始人的经历、认知、经验会(huì)影响每一个决策,你的孩子总是像你。但孩子在成长过程中(zhōng),如何去教会(jiàohuì)他面对困难时勇往直前的勇气?如何让他在各种极限压力下变得更坚韧?小孩难免会犯错,但不能犯大错,否则公司就完了。要有快速纠错的能力,摸着石头过河,边做边学(biānxué),持续成长。
大家好,我是(shì)爱诗科技的王长虎。很荣幸(róngxìng)这次被邀请来到智源大会的大模型产业论坛上进行分享(fēnxiǎng)。一年前,我主要分享的是技术方面的内容。但过了一年,总得有点进步,是吧?所以今天我想和大家聊聊产品(chǎnpǐn)。今天的主题是“PixVerse(拍我AI)如何打造一个(yígè)受人喜爱的产品”。PixVerse这个名字有些拗口,因为它是一个海外产品。为了方便大家,我们今天给(gěi)它起了一个中文名字,叫做“拍我AI”。其实,这次分享并不是一个成功的经验总结,因为我们依然处于创业阶段,大家都知道(zhīdào),创业就像在刀尖上行走。所以,我今天介绍产品发展历程的同时,也想分享一下我这两年(liǎngnián)创业过程中的心路历程。其实,就是(jiùshì)给大家讲(jiǎng)一个故事。其中,我会重点介绍三个影响(yǐngxiǎng)我们发展的关键决策。
刚才(gāngcái)看到大海(dàhǎi)兄的PPT,做得非常棒,而我的PPT没那么高大上,每(měi)一个字都(dōu)是我自己写的。我想知道有多少人了解PixVerse这个产品,我很开心看到还是有不少人知道的。不过,它在国内的知名度(zhīmíngdù)并不高,因为它是一个海外产品。所以,我先用这一页PPT简单介绍一下这个产品的现状。
在过去的(de)一年里,爱诗科技(kējì)的模型在全球范围内一直处于领先地位。这个评测是在一个特殊的时间点进行的,那就是2024年12月,当时Sora发布后,过了十个月才姗姗来迟,正好可以进行评测。第三方的评测结果(jiéguǒ)与大家(dàjiā)的认知一致:当Sora真正上线时,它已经不在第一梯队了。大家会发现,第一梯队的前三名分别是可灵、海螺和我们PixVerse。目前来看,这三家(zhèsānjiā)依然是全球用户量最多的三大图像生成(shēngchéng)产品(chǎnpǐn)。
同时,我们的产品发展迅速。我们的移动端于(duānyú)2024年12月正式上线(shàngxiàn),不到(dào)一个季度的时间,也就是在2025年2月,全球知名的投资机构a16z发布了一个全球100大人工智能应用排行榜。在移动端的排行榜上,我们排到了第52位。如果把(bǎ)我们的网页端也列入排名,应该能进入前20名。从去年(qùnián)10月份之后,我们的用户量增长非常快,到目前为止(mùqiánwéizhǐ),月活跃用户数已经超过了1600万(wàn)。当然,这也带来了营收的快速增长,不过有些数据我就不方便透露了。
回到两年(liǎngnián)前(qián),作为一名在人工智能(réngōngzhìnéng)领域已经(yǐjīng)闯荡了(le)20多年(duōnián)的老兵,很多人都问我,为什么那么想不开要出来创业?尤其是在2023年,整个融资环境非常差。但激励我迈出这一步的,是因为我们看到了一个新时代的到来。所以,我们在2023年4月走上了创业之路,这也是我们公司成立的时间。事实上,从ChatGPT在2022年年底上线后,我们就开始筹备创业了。
1、出来创业要(yào)做什么
所以,我们面临的第一个重要决策就是:出来创业要做什么?这并不是一个容易回答(huídá)的问题。特别是两年前,大(dà)家看看今天的论坛,一半以上的人都是做视频的,对吧?但两年前的情况(qíngkuàng)可不是这样(zhèyàng)的。当时,大语言模型的公司融资金额高达数百亿、数十亿甚至数亿美元。而视频生成赛道却冷清(lěngqīng)得很,只有少数几家公司。比如,Runway已经成立五六年了,当时融了数百万美元(shùbǎiwànměiyuán),海外还有一个叫Pika的公司,也是类似的情况。相比之下,就像(xiàng)蚂蚁和大象的关系,大家(dàjiā)能感受到视频生成赛道有多冷清吧?
当时,99%的投资人(rén)都跟我说,包括行业专家也说,视频生成五年内没法落地。因为当时最好的模型(móxíng)也不过如此。而图像(túxiàng)生成领域,Midjourney已经跑出来了,年营收达到(dádào)1亿美元。而且有(yǒu)了开源模型,你(nǐ)可以很方便地开发应用。所以,当时很多人建议我们,别做(zuò)大模型了,因为大模型很烧钱。而且,看好大模型行业的人不会投我们,因为他们觉得大模型没前途;而看好大模型赛道的人也不会投我们,因为前面有大语言(yǔyán)模型,那个领域更令人兴奋。当然,应用侧也有很多机会,比如可以做游戏、广告,直接变现。
但我们团队的认知是:既然我们有文生图和大语言模型的技术,为什么不做(zuò)视频生成呢?过去我在字节跳动陪伴抖音TikTok成长了好多年,我们的认知是视频是最贴近(tiējìn)用户的内容形态。如果当时(dāngshí)(dāngshí)不做视频生成,那就没有道理了。所以,我们选择了一个在当时并不被看好的方向(fāngxiàng),但我们内心认为这是正确的事。
我们决定全力投入(tóurù)视频生成领域,因为我们坚信(jiānxìn)视频生成一旦能够(nénggòu)落地,其(qí)产品化和商业化的潜力可能不亚于大语言模型。另一方面,我和我的团队曾经支撑(zhīchēng)过抖音、TikTok这些世界级产品的背后视频AI能力发展,我们有(yǒu)信心能够做出成绩。基于这两点,我们没有理由不做这件事。一旦做了这个决策,我们发现很多事情就比较顺利了。
这是一个时间(shíjiān)线。我们(wǒmen)在4月份(yuèfèn)成立公司(gōngsī),真正从7月份开始全力投入训练视频生成大模型。仅仅三个月的(de)时间,到了10月份,我们就已经进入了全球第一梯队。我们在2024年1月正式在海外上线了网页端。一个月后,也就是2月份,我们在各种排行榜上已经冲到了前面。
这是去年智源研究院和中超媒大学做的一次(yīcì)非常专业的评测。当时,我们(wǒmen)(wǒmen)的第一代模型表现不错,虽然有些指标可能(kěnéng)并不完美,但我们在全球范围内排名第二,在国内排名第一。当然,我们不能只看模型的排名,还要看产品本身的表现。我们在1月份上线后,仅一个月的时间,就在各种增速(zēngsù)(zēngsù)榜单上稳居(wěnjū)第一名。虽然新产品的增速快是正常的,但大家更关注的是访问量(fǎngwènliàng)的绝对值。当时,我们刚上线第一个月的访问量就已经和当时最著名的大语言模型产品,比如 豆包、Kimi,处于同一个量级。这对我们来说(láishuō)是非常令人兴奋的事情,一切似乎都很顺利。
但(dàn)是,大家还记得吗?2024年1月我们正式上线,在(zài)海外取得了非常好的口碑,大量用户开始使用。然而,到了2月份,Sora突然横空出世(héngkōngchūshì)。春节期间,我的微信响个不停,很多关心我的人给我发消息,问我:GPT出来后领先这么多,你们公司是不是就完蛋了?Sora出现(chūxiàn)后,你们是不是已经落后很多了?当然,现在我们知道Sora当时只是一个(yígè)幌子(huǎngzi),但它确实忽悠了不少人。
所以,很(hěn)多人(rén)发来关心的(de)消息,包括我们的投资人也很焦虑,我们的同行和(hé)朋友也很担心。但也有好的一面,因为Sora的出现,让这个方向(fāngxiàng)逐渐形成了共识。我们非常想要招揽的人才,突然给我们发来消息,表示要加入我们。这些人后来在公司的发展过程中起到了非常重要的作用。
2、Sora出现后,我们是跟还是不(bù)跟?
这引出了我们(wǒmen)的第二个重要决策:Sora出现后,我们是(shì)跟还是不跟?这是(zhèshì)一个很重要的问题。因为这个方向从一个非共识的状态(zhuàngtài)变成了一个非常热门的方向,留给小公司(gōngsī)(gōngsī)萎缩发展的机会结束了。很多大公司、大厂,比如Google、字节跳动、快手,以及融资金额是我们几十倍的大模型公司,纷纷加入竞争行列。竞争变得更加激烈了。
形成共识之后(zhīhòu),融资环境在2024年比2023年更差。很多人担心我们(wǒmen)是(shì)不是已经落后Sora很多了,还有没有机会(jīhuì)?我们的(de)(de)资金实力没有那么雄厚,怎么和人家竞争?虽然我们过去一年的发展还算不错,也拿到了第二轮融资,但宣传大模型需要的资源是过去10倍的。我们面临一个抉择:是继续训练大模型,还是放弃(fàngqì)转身做应用?这是一个生死存亡的时刻。我们的现金流只能支撑一次机会,如果训练不成功(chénggōng),就彻底完蛋了,没有第二次机会。在这种情况下,我们该怎么选择?
但要知道,创业就是勇往直前,既然已经迈出了第一步,第二步又有什么好怕的呢?所以我们决定全力投入(tóurù),但这(zhè)并不是盲目的。
首先(shǒuxiān),我们(wǒmen)是有前瞻性的。早在(zài)2023年,Sora还没有发布的时候,我们在和投资人规划路线图时就已经设计了(le)DIT架构,并且明确计划在第二年的春节前后,当我们拿到第二笔融资(róngzī)后,利用这些资金来支持我们训练更大规模的模型。如果不是Sora先发布,说不定我们才是第一个做出来的。所以,我们认同并且坚信这个路线。
第二点,我们(wǒmen)对自己团队的能力有(yǒu)信心。大家都知道,ChatGPT出现后,很多人认为(rènwéi)在(zài)大语言模型领域,中国落后美国很多。但因为ChatGPT太火了(le),这种认知被扩大到了整个AI领域,好像中国全面落后于美国。但实际上,过去几年(jǐnián)我们在抖音和TikTok上做的工作,以及我们团队在视频AI能力方面是领先全球的。这是我们的真实认知。因此,我们相信我们有能力做好这件(zhèjiàn)事,并且能够以十倍的效率、十倍低成本地完成。
当时,很多媒体朋友问我们:“你们什么时候能赶超GPT?”我很谨慎地和技术团队仔细评估后,觉得3到6个月是合理的。我们不想被打脸,所以(suǒyǐ)非常谨慎地给出了这个时间范围。实际上,后来的发展证明,虽然有些(yǒuxiē)吹牛的嫌疑,但(dàn)我们基本实现了这个目标(mùbiāo)。
从1月份正式上线(shàngxiàn)(shàngxiàn),到2月份月活用户数就超过了(le)百万。我们在三四月份开始筹备训练大模型,采购了很多机器设备,并搭建了DIT架构。仅仅三个(sāngè)月后,也(yě)就是7月份,我们正式上线了PixVerse的(de)产品。在爱诗科技和PixVerse没有发布这个概念之前(zhīqián),我们直接上线了产品,所以(suǒyǐ)我们在创业公司中大概是最早上线的。又过了三个月,也就是10月份,我们正式上线了V3版本。如果大家还记得(jìde)我们在第一页PPT上提到的内容,就会发现我们的用户量和营收都是从10月份开始快速增长的。这是一个重要的转折点。大家也可以看一下V3版本发布时的视频。
这是我们的产品页面,我们有一个功能选项叫做“Effect”(特效(tèxiào)),里面有多种特效模板。大家(dàjiā)是不是觉得第一个(dìyígè)很熟悉?没错,就是“毒液”特效,它非常火爆。
虽然我们是(shì)一个海外产品,国内(guónèi)用户可能无法直接使用,但它在抖音上(yīnshàng)意外地火了起来。如果你仔细观察,几乎(jīhū)每个相关(xiāngguān)视频上都有(yǒu)一个“PixVerse的logo,这种病毒式的传播效果非常好。当然,我们也有一些明星因为(yīnwèi)流量太大而自发模仿。它火到什么程度呢?在咸鱼上,你搜索“AI”,推荐的都是PixVerse的毒液特效生成内容,最贵(zuìguì)的甚至卖到18块钱一个。因为PixVerse是一个海外产品,所以(suǒyǐ)在国内火了之后,海外的热度也更高。我们在各种社交媒体上都爆火(bàohuǒ),而且不止(bùzhǐ)是毒液特效,很多其他内容也都火了。全球热度持续发酵。这里有一些数据,这是中国AI产品出海(chūhǎi)增速的排名,我们排在了第二名。11月份的访问量直接增长了近80%,在所有中国AI产品中排名第二,而且我们的流量已经远超第一名。
我特别喜欢张一鸣(zhāngyīmíng)说过的(de)一句话:“务实浪漫”。很多人会觉得务实和浪漫怎么能放在(fàngzài)一起呢?但我们认为,我们第二个决策——全力投入视频生成(shēngchéng)这件事,就是一个务实又浪漫的选择。当时真的是背水一战,资金只够训练一次,如果犯了大(dà)错误就再也没有机会了。所以,我想再和大家分享一下我们的一些观点。
做容易的(de)(de)事不是务实,短期投资也不是务实,做正确的事才是务实。我们(wǒmen)坚信我们选择(xuǎnzé)(xuǎnzé)的方向是正确的。认识世界的多样性是务实,而多样性本身就是一种务实的表现。很多人选择做大语言模型,而我们选择做视频,这就是独立思考,穿越(chuānyuè)喧嚣。有生命力、面向未来、拥抱不确定性,这些都是浪漫的体现。我们所做的事,正是如此。V3的成功背后有很多力量,包括我们过去全力投入视频生成(shēngchéng)的思考,背水一战的决心,以及我们称之为“行胜于言”的技术成果。不过,大家可能注意到,这些都还是关于技术的。那么(nàme),产品呢?
3、做(zuò)ToB还是ToC?
这就引出(yǐnchū)了我们的第三个战略决策:要做什么样的产品?V3的成功是技术和产品的双重(shuāngchóng)成功。
做(zuò)ToB还是ToC?早(zǎo)在创业初期,我们并不确定,但当我们全力投入之后,目标就变得清晰了:我们要(yào)服务哪些用户?如何设计我们的产品?从全力投入视频生成的那一刻起,我们的愿景(yuànjǐng)就是帮助每一个人成为生活的导演。
但具体是先做ToB还是ToC?我们(wǒmen)决定先做ToC,再做ToB。我们认为我们是一个全球化(quánqiúhuà)团队,伴随着抖音和TikTok的(de)发展,我们积累了全球化的经验和资源。在(zài)有限(yǒuxiàn)的资源下,我们优先选择海外市场,然后再拓展国内市场。我们的目标(mùbiāo)是让(ràng)每一个能玩抖音、TikTok的人成为生活的导演,让几十亿普通人能够使用我们的产品。有了这个目标,后续的方向就很清晰(qīngxī)了:我们要做好两件事情,一是如何降低普通人的创作门槛,二是如何提升普通人的创作体验。
我们再回头看看那个爆点,毒液变身为什么能(néng)成功?用户只需(xū)要上传一张(yīzhāng)照片,然后选择(xuǎnzé)一个模板,比如肌肉模板,哇!不需要输入Prompt(提示词),就能生成这样一个视频。他们也可以选择毒液变身,大家很熟悉吧?还可以一起摇摆(yáobǎi),是不是很好用?所以(suǒyǐ)V3为什么成功?首先,我们做到了降低创作门槛,不再需要输入Prompt,只需上传一张照片就OK,每个人都能做到。
第二,我们提升了创作(chuàngzuò)者的体验。要(yào)知道,在此之前,所有产品都在服务于那些有明确创作目标的创作者,他们可以容忍一些不完美的地方。比如,生成(shēngchéng)10个(gè)视频才有一个可用(yòng),抽卡(chōukǎ)概率是1/10;生成5个视频才有一个可用,抽卡概率是20%。普通人(pǔtōngrén)谁会去(qù)用?生成第一个视频不满意,他们就不会生成第二个了。我们的成功之处在于,我们将抽卡成功率直接拉到接近100%。任何一个普通用户,哪怕是没有经验的用户,生成第一个视频就能成功,他们就会去传播。
所以,去年(qùnián)2024年4月和10月,我们的(de)V3和产品上线,这是(zhèshì)第一次(dìyīcì)真正让普通用户、普通消费者(xiāofèizhě)用AI能力(nénglì)创造出过去无法创造出来的视频。在我心中,这一刻才是视频生成的“GPT时刻”——好的模型带来了好的产品。当然,这个火了,谁都能看到,同行们也都看到了,所以他们快速上线了类似的毒液变身能力。但好的模型带来好的体验,为什么说V3是全球最能打(dǎ)的模型?我们不是只看榜单的数据,而是通过对比来看(láikàn)。左边是一个同行的产品,左右变身是一个非常重要、非常强的同行,他们当时也上线了类似的能力。
上传这样一张照片,看看它是(shì)怎么变身的?这个转场不太自然,生成的毒气和人物不太相关。大家会去传播这样的视频给自己的朋友圈吗?右边是我们(wǒmen)(wǒmen)的产品。所以,用户喜欢是因为模型好。有了这个认知(rènzhī)之后,我们该怎么办?我们要做得更好,我们要做更好的模型。
毒液(dúyè)变身火(huǒ)了(le)之后,大家对毒液的印象可能更深刻,还是(shì)对PixVerse的印象更深刻?很容易说(shuō),这个东西很多家都有,毒液变身能力很常见(chángjiàn),那(nà)到底是毒液变身火了,还是PixVerse火了?这是一个佐证:这是GoogleTrends上的搜索指数。我们从10月初开始,搜索指数(蓝色曲线)直线飙升。中间两条曲线分别是全球(quánqiú)最好的视频生成模型产品Sora和Runway。Runway的曲线虚高是因为“Runway”是一个常见单词。我们的搜索指数已经远超它们。所以(suǒyǐ),视频生成的“GPT时刻”不是毒液变身火了,而是PixVerse火了。
既然我们(wǒmen)要做更(gèng)好的模型,速度也很快。我们在10月(yuè)上线了V3,12月上线了V3.5,因为我们觉得普通用(yòng)户没有耐心(nàixīn)等待视频(shìpín)生成。过去,视频生成大多是分钟级别,一分钟、几分钟甚至十几分钟。我们直接(zhíjiē)将其缩短到十秒以内,这就是V3.5。这样我们就可以支撑移动(yídòng)端APP上线这个产品,普通用户就可以使用了。否则,普通人不会花那么多时间等待生成。2月我们上线了V4,速度更快,还支持实时生成效果。5月上线了V4.5,每一代都有巨大的进化。我就不详细介绍了,只说一些(yīxiē)亮点。比如(bǐrú)V3.3.5是全球最快的视频生成模型,当然也有其他能力,比如我们提供首尾帧生成。用户上传一张视频的首帧(shǒuzhēn)和尾帧图片,我们就能生成从第一帧过渡到最后一帧的视频。比如,打开一扇门,镜头钻进去,看到一个(yígè)新世界。视频里的所有镜头都是用这个能力生成的,这样给大家提供了更多玩法(wánfǎ)。
模型好不能(bùnéng)自吹自擂,产品好也不能自吹自擂。这是1月份(yuèfèn)的时候,全球AI产品增长榜上出现了(le)一个历史性事件:Deepseek横空出世。当时,在访问量和增速上同时超过我们(wǒmen)的只有Deepseek。
2025年2月(yuè),V4上线了,它不仅更快,几乎5秒钟就能生成5秒钟的(de)(de)视频,几乎接近实时。同时,它让视频生成进入了有声时代。大家知道最近的 Veo3上线了带声音的生成,但实际上我们早在2月就已经上线了。大家可以看一下过去的视频,过去媒体传播时的声音都(dōu)是(shì)创作者后期添加的,而我们是同时生成的。
当然,也(yě)(yě)可以指定视频中的(de)人物说哪些话,口型也能对上。很多其他能力(nénglì)我就不具体介绍了。AI发对象这个功能是(shì)2月上线(shàngxiàn)的。到了4月,这是中国产品(chǎnpǐn)出海总榜(zǒngbǎng)(移动端),刚才提到的是网页端。在所有中国AI产品中,出海产品在月活跃用户(MAU)和增长上超过我们的只有 Deepseek,所以也很令人敬仰。2025年5月,也就是上个月,我们的V4.5正式(zhèngshì)上线,它带来了非常多的功能,进阶的消费者也能创作电影级的内容(nèiróng),包括多角色联动的能力。大家可以看一下这个视频,体现了各种专业运镜。你的小猫比底更会运镜,可以看到各种专业的运镜,多个主体快速推进。什么叫多主体?就是上传两张照片生成(shēngchéng)一个视频,主体在这个背景里畅游。这就是生成的内容。
5月其实发生了(le)一件让我们非常开心(kāixīn)的(de)事情。一大早起来,同事(tóngshì)和朋友给我发消息说,在美国的总榜上(bǎngshàng),iOS总榜上,我们跑得很前面。这是(shì)(shì)美国的总榜,第一个是所有APP的总榜,我们排到第四名(dìsìmíng)。可以(kěyǐ)看到,排在前面和后面的包括GoogleMap、剪映、WhatsApp,当然还有一些半隐藏的,比如TikTok。在“PhotoandVideo”这个榜上,我们排到了第一名,后面是剪映、Instagram、YouTube、Canvas、SnapChat等等。我们非常开心,虽然不可能一直(yìzhí)霸榜,但那一刻(nàyīkè)我们非常开心。目前,已经(yǐjīng)有超过6000万用户在使用PixVerse。大家很好奇,这些人用它来干啥?大家可以去TikTok里搜索PixVerse,可以看到很多用PixVerse生成的视频,用户是怎么用的。
噢,这首歌没放(fàng)出来,因为时间关系,我就跳过去了(le),大家可以自己去看一下。1月份的时候,我们的产品在国外已经(yǐjīng)非常(fēicháng)火爆(huǒbào),很多B端客户,也就是企业用户(yònghù)找到我们,说能不能用你们的API?我们有很多能力可以用,我说我们已经有基于超过6000万用户的最佳实践了,我们知道他们喜欢什么,爱用什么,怎么用。这些(zhèxiē)能力真的可以赋能全球的B端客户。所以从1月份开始,我们逐渐开展(kāizhǎn)B端业务,支持各行业的API和定制化视频生成,覆盖了非常多场景,比如互联网营销、电商等等。
这里就不多介绍了。但我们(wǒmen)的(de)产品依然是海外产品,大家在国内的APPStore上搜索,全是盗版(dàobǎn)。很多人跟我说你们产品不好,我说我们也没上线(shàngxiàn)。所以应(yīng)用户的要求,我们筹备了几个月时间,今天正式在国内全面上线公测,名字叫“拍我AI”。它很全面,在国内各应用商店都可以下载,包括网页端。它是最新的,对齐了PixVerse最新的模型和所有(suǒyǒu)(yǒu)功能。同时,它是一个中国化的模型,有中国风、中国味的模板和内容。
同时,我(wǒ)们有一个新(xīn)的域名,因为(yīnwèi)PixVerse 太绕口了,对中国用户来说太不(bù)友好。我们给它起了一个名字叫“拍(pāi)我”,所以域名是(shì)“拍我AIPadvideo”,很好记。同时,我们的B端服务也全面升级。拍我AI,这个名字对英语不好的人来说可能有点像,但它有自己独特的命名原因。大家可以看一下,这些视频镜头都是由拍我AI生成的。
特别幸运,创业两年(liǎngnián)依然留在牌桌上,一切又似乎很美好。但这里为什么又似曾相识?跟去年年初很像。创业之路任重道远,需要在刀尖上求生存。我(wǒ)们有很多(hěnduō)竞争对手,过去两年其实有很多同行被落下,但真正触动我的(de)是今年上半年,我们一直在关注的一个产品——Hyper突然暂停服务(fúwù)了,这让我触动很大,因为它一直在我们的竞品(jìngpǐn)名单上。
创业很不易,未来还有很多挑战,技术迭代快?如何(rúhé)持续保持在第一梯队?过去两年的(de)成功并不代表未来两年也能成功。大模型(móxíng)很烧钱,我们不像大厂那样有雄厚的资金,但我们能高效地花钱,不过依然需要烧钱。如何持续融资?如何确保现金流的健康?如何加速商业化?不止于做一个工具,如何做好产品差异化?如何建立竞争(jìngzhēng)壁垒?如何应对(yìngduì)大厂的竞争?如何应对开源生态(shēngtài)?这些都是未来爱诗(àishī)科技、PixVerse以及 拍我AI需要进一步思考的问题。
其实,过去这两年我是(shì)懵着创业的(de),一头扎下去,然后再想下一步该干啥。所以,过去两年的三个重要决策,深刻影响了产品的发展。其实都是在边做边学。学到的一个很重要的点是:企业是有(yǒu)生命的,就像一个小孩,你的孩子。创始人的经历(jīnglì)、认知、经验会影响每一个决策,你的孩子总是像你。但孩子在成长过程中(zhōng),如何去教会他面对困难时勇往直前的勇气?如何让他在各种极限压力下变得更坚韧?小孩难免会(nánmiǎnhuì)犯错(fàncuò),但不能犯大错,否则公司就完了。要有快速纠错(jiūcuò)的能力,摸着石头过河,边做边学,持续(chíxù)成长。因为时间有限,很多其他认知就没办法在这里展开了。
其实,创业(chuàngyè)这两年是很孤独的,尤其是当你跟99个投资人(tóuzīrén)聊过,又跟第100个投资人聊,前99个都不看好你的方向,你会(huì)很孤独。创业是一段(yīduàn)孤独的旅程,就像在戈壁滩上独自行走。但同时,它又是一场非常(fēicháng)幸福的修行,你会遇到很多懂你的人,和你一起(yìqǐ)战斗的人。你可以看着你的“孩子”逐渐有性格,变得越来越强壮,这是一件非常开心的事。最后,我(wǒ)想向这个时代最有梦想的人致敬,谢谢大家,谢谢!

2025年6月6日(rì)-7日,第7届北京智源大会将以线上+线下联动的形式召开,6日下午推出“大模型产业CEO”主题论坛,邀请业内知名专家学者(zhuānjiāxuézhě)、大模型领域领军(lǐngjūn)企业CEO。
爱诗科技CEO王长虎发表(fābiǎo)了主题演讲——“PixVerse(拍我AI)如何打造一个受人喜爱的(de)产品”,他介绍了PixVerse的发展历程,以及(yǐjí)影响其发展的三个关键决策。
我们(wǒmen)的认知是视频是最贴近用户的内容(nèiróng)形态,视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。
Sora出现让视频(shìpín)从一个非(fēi)共识的状态,变成了一个非常热门的方向;
ChatGPT出现后,很多人认为在大语言模型领域,中国落后美国很多。但因为(yīnwèi)ChatGPT太火了,这种认知(rènzhī)被扩大到了整个AI领域,好像中国全面落后于(yú)美国。但实际上,过去几年我们在抖音(dǒuyīn)和TikTok上做的工作,以及我们团队在视频AI能力方面是领先(lǐngxiān)全球的。
从全力投入视频生成的那一刻起,我们的愿景就是帮助每一个(yígè)人成为生活的导演。有了(le)这个目标,后续的方向就很清晰了:我们要做好两件事情,一是如何(rúhé)降低普通人的创作门槛,二是如何提升(tíshēng)普通人的创作体验。
我们(wǒmen)决定(juédìng)先做ToC,再做ToB。我们认为我们是一个全球化团队,伴随(bànsuí)着(zhe)抖音和TikTok的发展,我们积累了全球化的经验和资源。在有限的资源下,我们优先选择海外市场,然后再拓展国内市场。
好的模型带来(dàilái)了(le)好的产品,有了这个认知之后,我们要做得更好,我们要做更好的模型。
企业是有生命的,就像一个小孩,你的孩子(háizi)。创始人的经历、认知、经验会(huì)影响每一个决策,你的孩子总是像你。但孩子在成长过程中(zhōng),如何去教会(jiàohuì)他面对困难时勇往直前的勇气?如何让他在各种极限压力下变得更坚韧?小孩难免会犯错,但不能犯大错,否则公司就完了。要有快速纠错的能力,摸着石头过河,边做边学(biānxué),持续成长。
大家好,我是(shì)爱诗科技的王长虎。很荣幸(róngxìng)这次被邀请来到智源大会的大模型产业论坛上进行分享(fēnxiǎng)。一年前,我主要分享的是技术方面的内容。但过了一年,总得有点进步,是吧?所以今天我想和大家聊聊产品(chǎnpǐn)。今天的主题是“PixVerse(拍我AI)如何打造一个(yígè)受人喜爱的产品”。PixVerse这个名字有些拗口,因为它是一个海外产品。为了方便大家,我们今天给(gěi)它起了一个中文名字,叫做“拍我AI”。其实,这次分享并不是一个成功的经验总结,因为我们依然处于创业阶段,大家都知道(zhīdào),创业就像在刀尖上行走。所以,我今天介绍产品发展历程的同时,也想分享一下我这两年(liǎngnián)创业过程中的心路历程。其实,就是(jiùshì)给大家讲(jiǎng)一个故事。其中,我会重点介绍三个影响(yǐngxiǎng)我们发展的关键决策。
刚才(gāngcái)看到大海(dàhǎi)兄的PPT,做得非常棒,而我的PPT没那么高大上,每(měi)一个字都(dōu)是我自己写的。我想知道有多少人了解PixVerse这个产品,我很开心看到还是有不少人知道的。不过,它在国内的知名度(zhīmíngdù)并不高,因为它是一个海外产品。所以,我先用这一页PPT简单介绍一下这个产品的现状。
在过去的(de)一年里,爱诗科技(kējì)的模型在全球范围内一直处于领先地位。这个评测是在一个特殊的时间点进行的,那就是2024年12月,当时Sora发布后,过了十个月才姗姗来迟,正好可以进行评测。第三方的评测结果(jiéguǒ)与大家(dàjiā)的认知一致:当Sora真正上线时,它已经不在第一梯队了。大家会发现,第一梯队的前三名分别是可灵、海螺和我们PixVerse。目前来看,这三家(zhèsānjiā)依然是全球用户量最多的三大图像生成(shēngchéng)产品(chǎnpǐn)。
同时,我们的产品发展迅速。我们的移动端于(duānyú)2024年12月正式上线(shàngxiàn),不到(dào)一个季度的时间,也就是在2025年2月,全球知名的投资机构a16z发布了一个全球100大人工智能应用排行榜。在移动端的排行榜上,我们排到了第52位。如果把(bǎ)我们的网页端也列入排名,应该能进入前20名。从去年(qùnián)10月份之后,我们的用户量增长非常快,到目前为止(mùqiánwéizhǐ),月活跃用户数已经超过了1600万(wàn)。当然,这也带来了营收的快速增长,不过有些数据我就不方便透露了。
回到两年(liǎngnián)前(qián),作为一名在人工智能(réngōngzhìnéng)领域已经(yǐjīng)闯荡了(le)20多年(duōnián)的老兵,很多人都问我,为什么那么想不开要出来创业?尤其是在2023年,整个融资环境非常差。但激励我迈出这一步的,是因为我们看到了一个新时代的到来。所以,我们在2023年4月走上了创业之路,这也是我们公司成立的时间。事实上,从ChatGPT在2022年年底上线后,我们就开始筹备创业了。
1、出来创业要(yào)做什么
所以,我们面临的第一个重要决策就是:出来创业要做什么?这并不是一个容易回答(huídá)的问题。特别是两年前,大(dà)家看看今天的论坛,一半以上的人都是做视频的,对吧?但两年前的情况(qíngkuàng)可不是这样(zhèyàng)的。当时,大语言模型的公司融资金额高达数百亿、数十亿甚至数亿美元。而视频生成赛道却冷清(lěngqīng)得很,只有少数几家公司。比如,Runway已经成立五六年了,当时融了数百万美元(shùbǎiwànměiyuán),海外还有一个叫Pika的公司,也是类似的情况。相比之下,就像(xiàng)蚂蚁和大象的关系,大家(dàjiā)能感受到视频生成赛道有多冷清吧?
当时,99%的投资人(rén)都跟我说,包括行业专家也说,视频生成五年内没法落地。因为当时最好的模型(móxíng)也不过如此。而图像(túxiàng)生成领域,Midjourney已经跑出来了,年营收达到(dádào)1亿美元。而且有(yǒu)了开源模型,你(nǐ)可以很方便地开发应用。所以,当时很多人建议我们,别做(zuò)大模型了,因为大模型很烧钱。而且,看好大模型行业的人不会投我们,因为他们觉得大模型没前途;而看好大模型赛道的人也不会投我们,因为前面有大语言(yǔyán)模型,那个领域更令人兴奋。当然,应用侧也有很多机会,比如可以做游戏、广告,直接变现。
但我们团队的认知是:既然我们有文生图和大语言模型的技术,为什么不做(zuò)视频生成呢?过去我在字节跳动陪伴抖音TikTok成长了好多年,我们的认知是视频是最贴近(tiējìn)用户的内容形态。如果当时(dāngshí)(dāngshí)不做视频生成,那就没有道理了。所以,我们选择了一个在当时并不被看好的方向(fāngxiàng),但我们内心认为这是正确的事。
我们决定全力投入(tóurù)视频生成领域,因为我们坚信(jiānxìn)视频生成一旦能够(nénggòu)落地,其(qí)产品化和商业化的潜力可能不亚于大语言模型。另一方面,我和我的团队曾经支撑(zhīchēng)过抖音、TikTok这些世界级产品的背后视频AI能力发展,我们有(yǒu)信心能够做出成绩。基于这两点,我们没有理由不做这件事。一旦做了这个决策,我们发现很多事情就比较顺利了。
这是一个时间(shíjiān)线。我们(wǒmen)在4月份(yuèfèn)成立公司(gōngsī),真正从7月份开始全力投入训练视频生成大模型。仅仅三个月的(de)时间,到了10月份,我们就已经进入了全球第一梯队。我们在2024年1月正式在海外上线了网页端。一个月后,也就是2月份,我们在各种排行榜上已经冲到了前面。
这是去年智源研究院和中超媒大学做的一次(yīcì)非常专业的评测。当时,我们(wǒmen)(wǒmen)的第一代模型表现不错,虽然有些指标可能(kěnéng)并不完美,但我们在全球范围内排名第二,在国内排名第一。当然,我们不能只看模型的排名,还要看产品本身的表现。我们在1月份上线后,仅一个月的时间,就在各种增速(zēngsù)(zēngsù)榜单上稳居(wěnjū)第一名。虽然新产品的增速快是正常的,但大家更关注的是访问量(fǎngwènliàng)的绝对值。当时,我们刚上线第一个月的访问量就已经和当时最著名的大语言模型产品,比如 豆包、Kimi,处于同一个量级。这对我们来说(láishuō)是非常令人兴奋的事情,一切似乎都很顺利。
但(dàn)是,大家还记得吗?2024年1月我们正式上线,在(zài)海外取得了非常好的口碑,大量用户开始使用。然而,到了2月份,Sora突然横空出世(héngkōngchūshì)。春节期间,我的微信响个不停,很多关心我的人给我发消息,问我:GPT出来后领先这么多,你们公司是不是就完蛋了?Sora出现(chūxiàn)后,你们是不是已经落后很多了?当然,现在我们知道Sora当时只是一个(yígè)幌子(huǎngzi),但它确实忽悠了不少人。
所以,很(hěn)多人(rén)发来关心的(de)消息,包括我们的投资人也很焦虑,我们的同行和(hé)朋友也很担心。但也有好的一面,因为Sora的出现,让这个方向(fāngxiàng)逐渐形成了共识。我们非常想要招揽的人才,突然给我们发来消息,表示要加入我们。这些人后来在公司的发展过程中起到了非常重要的作用。
2、Sora出现后,我们是跟还是不(bù)跟?
这引出了我们(wǒmen)的第二个重要决策:Sora出现后,我们是(shì)跟还是不跟?这是(zhèshì)一个很重要的问题。因为这个方向从一个非共识的状态(zhuàngtài)变成了一个非常热门的方向,留给小公司(gōngsī)(gōngsī)萎缩发展的机会结束了。很多大公司、大厂,比如Google、字节跳动、快手,以及融资金额是我们几十倍的大模型公司,纷纷加入竞争行列。竞争变得更加激烈了。
形成共识之后(zhīhòu),融资环境在2024年比2023年更差。很多人担心我们(wǒmen)是(shì)不是已经落后Sora很多了,还有没有机会(jīhuì)?我们的(de)(de)资金实力没有那么雄厚,怎么和人家竞争?虽然我们过去一年的发展还算不错,也拿到了第二轮融资,但宣传大模型需要的资源是过去10倍的。我们面临一个抉择:是继续训练大模型,还是放弃(fàngqì)转身做应用?这是一个生死存亡的时刻。我们的现金流只能支撑一次机会,如果训练不成功(chénggōng),就彻底完蛋了,没有第二次机会。在这种情况下,我们该怎么选择?
但要知道,创业就是勇往直前,既然已经迈出了第一步,第二步又有什么好怕的呢?所以我们决定全力投入(tóurù),但这(zhè)并不是盲目的。
首先(shǒuxiān),我们(wǒmen)是有前瞻性的。早在(zài)2023年,Sora还没有发布的时候,我们在和投资人规划路线图时就已经设计了(le)DIT架构,并且明确计划在第二年的春节前后,当我们拿到第二笔融资(róngzī)后,利用这些资金来支持我们训练更大规模的模型。如果不是Sora先发布,说不定我们才是第一个做出来的。所以,我们认同并且坚信这个路线。
第二点,我们(wǒmen)对自己团队的能力有(yǒu)信心。大家都知道,ChatGPT出现后,很多人认为(rènwéi)在(zài)大语言模型领域,中国落后美国很多。但因为ChatGPT太火了(le),这种认知被扩大到了整个AI领域,好像中国全面落后于美国。但实际上,过去几年(jǐnián)我们在抖音和TikTok上做的工作,以及我们团队在视频AI能力方面是领先全球的。这是我们的真实认知。因此,我们相信我们有能力做好这件(zhèjiàn)事,并且能够以十倍的效率、十倍低成本地完成。
当时,很多媒体朋友问我们:“你们什么时候能赶超GPT?”我很谨慎地和技术团队仔细评估后,觉得3到6个月是合理的。我们不想被打脸,所以(suǒyǐ)非常谨慎地给出了这个时间范围。实际上,后来的发展证明,虽然有些(yǒuxiē)吹牛的嫌疑,但(dàn)我们基本实现了这个目标(mùbiāo)。
从1月份正式上线(shàngxiàn)(shàngxiàn),到2月份月活用户数就超过了(le)百万。我们在三四月份开始筹备训练大模型,采购了很多机器设备,并搭建了DIT架构。仅仅三个(sāngè)月后,也(yě)就是7月份,我们正式上线了PixVerse的(de)产品。在爱诗科技和PixVerse没有发布这个概念之前(zhīqián),我们直接上线了产品,所以(suǒyǐ)我们在创业公司中大概是最早上线的。又过了三个月,也就是10月份,我们正式上线了V3版本。如果大家还记得(jìde)我们在第一页PPT上提到的内容,就会发现我们的用户量和营收都是从10月份开始快速增长的。这是一个重要的转折点。大家也可以看一下V3版本发布时的视频。
这是我们的产品页面,我们有一个功能选项叫做“Effect”(特效(tèxiào)),里面有多种特效模板。大家(dàjiā)是不是觉得第一个(dìyígè)很熟悉?没错,就是“毒液”特效,它非常火爆。

虽然我们是(shì)一个海外产品,国内(guónèi)用户可能无法直接使用,但它在抖音上(yīnshàng)意外地火了起来。如果你仔细观察,几乎(jīhū)每个相关(xiāngguān)视频上都有(yǒu)一个“PixVerse的logo,这种病毒式的传播效果非常好。当然,我们也有一些明星因为(yīnwèi)流量太大而自发模仿。它火到什么程度呢?在咸鱼上,你搜索“AI”,推荐的都是PixVerse的毒液特效生成内容,最贵(zuìguì)的甚至卖到18块钱一个。因为PixVerse是一个海外产品,所以(suǒyǐ)在国内火了之后,海外的热度也更高。我们在各种社交媒体上都爆火(bàohuǒ),而且不止(bùzhǐ)是毒液特效,很多其他内容也都火了。全球热度持续发酵。这里有一些数据,这是中国AI产品出海(chūhǎi)增速的排名,我们排在了第二名。11月份的访问量直接增长了近80%,在所有中国AI产品中排名第二,而且我们的流量已经远超第一名。
我特别喜欢张一鸣(zhāngyīmíng)说过的(de)一句话:“务实浪漫”。很多人会觉得务实和浪漫怎么能放在(fàngzài)一起呢?但我们认为,我们第二个决策——全力投入视频生成(shēngchéng)这件事,就是一个务实又浪漫的选择。当时真的是背水一战,资金只够训练一次,如果犯了大(dà)错误就再也没有机会了。所以,我想再和大家分享一下我们的一些观点。
做容易的(de)(de)事不是务实,短期投资也不是务实,做正确的事才是务实。我们(wǒmen)坚信我们选择(xuǎnzé)(xuǎnzé)的方向是正确的。认识世界的多样性是务实,而多样性本身就是一种务实的表现。很多人选择做大语言模型,而我们选择做视频,这就是独立思考,穿越(chuānyuè)喧嚣。有生命力、面向未来、拥抱不确定性,这些都是浪漫的体现。我们所做的事,正是如此。V3的成功背后有很多力量,包括我们过去全力投入视频生成(shēngchéng)的思考,背水一战的决心,以及我们称之为“行胜于言”的技术成果。不过,大家可能注意到,这些都还是关于技术的。那么(nàme),产品呢?
3、做(zuò)ToB还是ToC?
这就引出(yǐnchū)了我们的第三个战略决策:要做什么样的产品?V3的成功是技术和产品的双重(shuāngchóng)成功。
做(zuò)ToB还是ToC?早(zǎo)在创业初期,我们并不确定,但当我们全力投入之后,目标就变得清晰了:我们要(yào)服务哪些用户?如何设计我们的产品?从全力投入视频生成的那一刻起,我们的愿景(yuànjǐng)就是帮助每一个人成为生活的导演。
但具体是先做ToB还是ToC?我们(wǒmen)决定先做ToC,再做ToB。我们认为我们是一个全球化(quánqiúhuà)团队,伴随着抖音和TikTok的(de)发展,我们积累了全球化的经验和资源。在(zài)有限(yǒuxiàn)的资源下,我们优先选择海外市场,然后再拓展国内市场。我们的目标(mùbiāo)是让(ràng)每一个能玩抖音、TikTok的人成为生活的导演,让几十亿普通人能够使用我们的产品。有了这个目标,后续的方向就很清晰(qīngxī)了:我们要做好两件事情,一是如何降低普通人的创作门槛,二是如何提升普通人的创作体验。
我们再回头看看那个爆点,毒液变身为什么能(néng)成功?用户只需(xū)要上传一张(yīzhāng)照片,然后选择(xuǎnzé)一个模板,比如肌肉模板,哇!不需要输入Prompt(提示词),就能生成这样一个视频。他们也可以选择毒液变身,大家很熟悉吧?还可以一起摇摆(yáobǎi),是不是很好用?所以(suǒyǐ)V3为什么成功?首先,我们做到了降低创作门槛,不再需要输入Prompt,只需上传一张照片就OK,每个人都能做到。
第二,我们提升了创作(chuàngzuò)者的体验。要(yào)知道,在此之前,所有产品都在服务于那些有明确创作目标的创作者,他们可以容忍一些不完美的地方。比如,生成(shēngchéng)10个(gè)视频才有一个可用(yòng),抽卡(chōukǎ)概率是1/10;生成5个视频才有一个可用,抽卡概率是20%。普通人(pǔtōngrén)谁会去(qù)用?生成第一个视频不满意,他们就不会生成第二个了。我们的成功之处在于,我们将抽卡成功率直接拉到接近100%。任何一个普通用户,哪怕是没有经验的用户,生成第一个视频就能成功,他们就会去传播。
所以,去年(qùnián)2024年4月和10月,我们的(de)V3和产品上线,这是(zhèshì)第一次(dìyīcì)真正让普通用户、普通消费者(xiāofèizhě)用AI能力(nénglì)创造出过去无法创造出来的视频。在我心中,这一刻才是视频生成的“GPT时刻”——好的模型带来了好的产品。当然,这个火了,谁都能看到,同行们也都看到了,所以他们快速上线了类似的毒液变身能力。但好的模型带来好的体验,为什么说V3是全球最能打(dǎ)的模型?我们不是只看榜单的数据,而是通过对比来看(láikàn)。左边是一个同行的产品,左右变身是一个非常重要、非常强的同行,他们当时也上线了类似的能力。
上传这样一张照片,看看它是(shì)怎么变身的?这个转场不太自然,生成的毒气和人物不太相关。大家会去传播这样的视频给自己的朋友圈吗?右边是我们(wǒmen)(wǒmen)的产品。所以,用户喜欢是因为模型好。有了这个认知(rènzhī)之后,我们该怎么办?我们要做得更好,我们要做更好的模型。
毒液(dúyè)变身火(huǒ)了(le)之后,大家对毒液的印象可能更深刻,还是(shì)对PixVerse的印象更深刻?很容易说(shuō),这个东西很多家都有,毒液变身能力很常见(chángjiàn),那(nà)到底是毒液变身火了,还是PixVerse火了?这是一个佐证:这是GoogleTrends上的搜索指数。我们从10月初开始,搜索指数(蓝色曲线)直线飙升。中间两条曲线分别是全球(quánqiú)最好的视频生成模型产品Sora和Runway。Runway的曲线虚高是因为“Runway”是一个常见单词。我们的搜索指数已经远超它们。所以(suǒyǐ),视频生成的“GPT时刻”不是毒液变身火了,而是PixVerse火了。
既然我们(wǒmen)要做更(gèng)好的模型,速度也很快。我们在10月(yuè)上线了V3,12月上线了V3.5,因为我们觉得普通用(yòng)户没有耐心(nàixīn)等待视频(shìpín)生成。过去,视频生成大多是分钟级别,一分钟、几分钟甚至十几分钟。我们直接(zhíjiē)将其缩短到十秒以内,这就是V3.5。这样我们就可以支撑移动(yídòng)端APP上线这个产品,普通用户就可以使用了。否则,普通人不会花那么多时间等待生成。2月我们上线了V4,速度更快,还支持实时生成效果。5月上线了V4.5,每一代都有巨大的进化。我就不详细介绍了,只说一些(yīxiē)亮点。比如(bǐrú)V3.3.5是全球最快的视频生成模型,当然也有其他能力,比如我们提供首尾帧生成。用户上传一张视频的首帧(shǒuzhēn)和尾帧图片,我们就能生成从第一帧过渡到最后一帧的视频。比如,打开一扇门,镜头钻进去,看到一个(yígè)新世界。视频里的所有镜头都是用这个能力生成的,这样给大家提供了更多玩法(wánfǎ)。
模型好不能(bùnéng)自吹自擂,产品好也不能自吹自擂。这是1月份(yuèfèn)的时候,全球AI产品增长榜上出现了(le)一个历史性事件:Deepseek横空出世。当时,在访问量和增速上同时超过我们(wǒmen)的只有Deepseek。
2025年2月(yuè),V4上线了,它不仅更快,几乎5秒钟就能生成5秒钟的(de)(de)视频,几乎接近实时。同时,它让视频生成进入了有声时代。大家知道最近的 Veo3上线了带声音的生成,但实际上我们早在2月就已经上线了。大家可以看一下过去的视频,过去媒体传播时的声音都(dōu)是(shì)创作者后期添加的,而我们是同时生成的。
当然,也(yě)(yě)可以指定视频中的(de)人物说哪些话,口型也能对上。很多其他能力(nénglì)我就不具体介绍了。AI发对象这个功能是(shì)2月上线(shàngxiàn)的。到了4月,这是中国产品(chǎnpǐn)出海总榜(zǒngbǎng)(移动端),刚才提到的是网页端。在所有中国AI产品中,出海产品在月活跃用户(MAU)和增长上超过我们的只有 Deepseek,所以也很令人敬仰。2025年5月,也就是上个月,我们的V4.5正式(zhèngshì)上线,它带来了非常多的功能,进阶的消费者也能创作电影级的内容(nèiróng),包括多角色联动的能力。大家可以看一下这个视频,体现了各种专业运镜。你的小猫比底更会运镜,可以看到各种专业的运镜,多个主体快速推进。什么叫多主体?就是上传两张照片生成(shēngchéng)一个视频,主体在这个背景里畅游。这就是生成的内容。
5月其实发生了(le)一件让我们非常开心(kāixīn)的(de)事情。一大早起来,同事(tóngshì)和朋友给我发消息说,在美国的总榜上(bǎngshàng),iOS总榜上,我们跑得很前面。这是(shì)(shì)美国的总榜,第一个是所有APP的总榜,我们排到第四名(dìsìmíng)。可以(kěyǐ)看到,排在前面和后面的包括GoogleMap、剪映、WhatsApp,当然还有一些半隐藏的,比如TikTok。在“PhotoandVideo”这个榜上,我们排到了第一名,后面是剪映、Instagram、YouTube、Canvas、SnapChat等等。我们非常开心,虽然不可能一直(yìzhí)霸榜,但那一刻(nàyīkè)我们非常开心。目前,已经(yǐjīng)有超过6000万用户在使用PixVerse。大家很好奇,这些人用它来干啥?大家可以去TikTok里搜索PixVerse,可以看到很多用PixVerse生成的视频,用户是怎么用的。
噢,这首歌没放(fàng)出来,因为时间关系,我就跳过去了(le),大家可以自己去看一下。1月份的时候,我们的产品在国外已经(yǐjīng)非常(fēicháng)火爆(huǒbào),很多B端客户,也就是企业用户(yònghù)找到我们,说能不能用你们的API?我们有很多能力可以用,我说我们已经有基于超过6000万用户的最佳实践了,我们知道他们喜欢什么,爱用什么,怎么用。这些(zhèxiē)能力真的可以赋能全球的B端客户。所以从1月份开始,我们逐渐开展(kāizhǎn)B端业务,支持各行业的API和定制化视频生成,覆盖了非常多场景,比如互联网营销、电商等等。
这里就不多介绍了。但我们(wǒmen)的(de)产品依然是海外产品,大家在国内的APPStore上搜索,全是盗版(dàobǎn)。很多人跟我说你们产品不好,我说我们也没上线(shàngxiàn)。所以应(yīng)用户的要求,我们筹备了几个月时间,今天正式在国内全面上线公测,名字叫“拍我AI”。它很全面,在国内各应用商店都可以下载,包括网页端。它是最新的,对齐了PixVerse最新的模型和所有(suǒyǒu)(yǒu)功能。同时,它是一个中国化的模型,有中国风、中国味的模板和内容。
同时,我(wǒ)们有一个新(xīn)的域名,因为(yīnwèi)PixVerse 太绕口了,对中国用户来说太不(bù)友好。我们给它起了一个名字叫“拍(pāi)我”,所以域名是(shì)“拍我AIPadvideo”,很好记。同时,我们的B端服务也全面升级。拍我AI,这个名字对英语不好的人来说可能有点像,但它有自己独特的命名原因。大家可以看一下,这些视频镜头都是由拍我AI生成的。
特别幸运,创业两年(liǎngnián)依然留在牌桌上,一切又似乎很美好。但这里为什么又似曾相识?跟去年年初很像。创业之路任重道远,需要在刀尖上求生存。我(wǒ)们有很多(hěnduō)竞争对手,过去两年其实有很多同行被落下,但真正触动我的(de)是今年上半年,我们一直在关注的一个产品——Hyper突然暂停服务(fúwù)了,这让我触动很大,因为它一直在我们的竞品(jìngpǐn)名单上。

创业很不易,未来还有很多挑战,技术迭代快?如何(rúhé)持续保持在第一梯队?过去两年的(de)成功并不代表未来两年也能成功。大模型(móxíng)很烧钱,我们不像大厂那样有雄厚的资金,但我们能高效地花钱,不过依然需要烧钱。如何持续融资?如何确保现金流的健康?如何加速商业化?不止于做一个工具,如何做好产品差异化?如何建立竞争(jìngzhēng)壁垒?如何应对(yìngduì)大厂的竞争?如何应对开源生态(shēngtài)?这些都是未来爱诗(àishī)科技、PixVerse以及 拍我AI需要进一步思考的问题。
其实,过去这两年我是(shì)懵着创业的(de),一头扎下去,然后再想下一步该干啥。所以,过去两年的三个重要决策,深刻影响了产品的发展。其实都是在边做边学。学到的一个很重要的点是:企业是有(yǒu)生命的,就像一个小孩,你的孩子。创始人的经历(jīnglì)、认知、经验会影响每一个决策,你的孩子总是像你。但孩子在成长过程中(zhōng),如何去教会他面对困难时勇往直前的勇气?如何让他在各种极限压力下变得更坚韧?小孩难免会(nánmiǎnhuì)犯错(fàncuò),但不能犯大错,否则公司就完了。要有快速纠错(jiūcuò)的能力,摸着石头过河,边做边学,持续(chíxù)成长。因为时间有限,很多其他认知就没办法在这里展开了。
其实,创业(chuàngyè)这两年是很孤独的,尤其是当你跟99个投资人(tóuzīrén)聊过,又跟第100个投资人聊,前99个都不看好你的方向,你会(huì)很孤独。创业是一段(yīduàn)孤独的旅程,就像在戈壁滩上独自行走。但同时,它又是一场非常(fēicháng)幸福的修行,你会遇到很多懂你的人,和你一起(yìqǐ)战斗的人。你可以看着你的“孩子”逐渐有性格,变得越来越强壮,这是一件非常开心的事。最后,我(wǒ)想向这个时代最有梦想的人致敬,谢谢大家,谢谢!

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎