各色科技,黄章晋和罗永浩都看好的“独特”基因检测创投

砍柴网 / 王航 / 2017-10-08 22:08
人工智能与医疗的结合正在成为医疗产业的大趋势,本系列报道将探访国内最先进的科技医疗公司,为大家理解AI在医疗领域的深入应用和实施带来启发与思考。

各色科技,黄章晋和罗永浩都看好的“独特”基因检测

基因是人体的生命密码,生理特征,健康以及性格都与基因有密切的关系。技术还不发达的时候,获取个人全基因组的成本还需要上万,但随着技术的成熟,全基因组的成本已经降到了万元以下,而对于部分基因变异的筛查检测,价格已经降到几百元。 

在基因检测的市场上,通过基因检测的数据预测疾病概率的较多,或者有些出于好奇心,通过基因检测求本溯源的需求也在市场上有所出现。基因检测一度成为投资追捧的风口,2015年,国内著名的媒体人黄章晋从大象公会的内部孵化了一个基因检测的项目,名为各色科技。 

甫一诞生,各色科技就目标明确,剑走偏锋,作为国内唯一聚焦心理-基因数据解读的专业团队,各色科技成功避开了业内同行在疾病易感基因预测领域内的你争我夺,正式产品上线仅数月,就交上了不错的成绩单。收获了超10万人的行为数据,各色搭建了目前国内最大的基因-行为数据库,这个数字每天都在良性增长中。 

基因检测的相关关联表象 

品途记者近日就此拜访了各色科技创始人兼CEO郭婷婷,深度了解了各色科技不同于其他基因检测公司的方向和未来。

市场环境中的基因检测 

拥有心理咨询与治疗硕士学位的郭婷婷,原本在中科院继续攻读认知神经科学博士。身为大象公会的约稿作者,机缘巧合地在大象公会遇到了一些同样对心理学、生物学、遗传学有浓厚兴趣的主笔和作者,大家都对人的基因携带的信息充满好奇。在对基因检测的一系列调研、分析中,一个中国前所未有的专注于个人基因数据解读的公司雏形诞生了。专业出身的郭婷婷很快主导了该项目,全身心投入,并且拉来了国内顶级心理学与遗传学实验室的科学家和算法研发的一线研究者共同加入,就此各色科技的核心团队不断夯实。 

“本质上我们是一家互联网科技公司,基因检测这件事,和AI关联密切。” 提及对AI的看法,郭婷婷开门见山介绍到,“产业相似度上,上游都是技术的不断更新,下游就涉及到供应链中的产品打造、商业模式等。DNA本身就是大数据,AI的算法同样可以应用到DNA数据分析中,有了AI的能力,可以从DNA数据中发现更多惊喜。”

 

各色创始人兼CEO郭婷婷 

目前获取DNA数据的成本已经越来越低,但获取数据后的解读结论则充满不确定性。 AI算法应用在基因数据分析时,需要在获得个体DNA数据的基础上,同时获得个体的的表型标注数据,才有可能产生一些新的发现。就算是国内拥有最多DNA测序数据的华大基因,对于相应表型数据的标注量也还很不够,这个领域的研究才刚刚开始。国外的基因检测公司23andMe,在2006年就在个体基因组数据解读领域探索,也是近期刚刚从FDA获得对少数疾病提供解读结论的许可,就是因为在现有的研究阶段,从DNA数据中获得的结论存在较大不确定性。 

郭婷婷还提到,为了获得更精准的基因-表型关联结论,需要用户不断提供自己生活中的的各种数据,建设一个既有DNA数据,又有表型标注数据的生命数据集。而基因检测传统的线下销售模式,难以获取如此多的数据。因此,目前很多公司只是根据现有的研究文献和公开数据库,找到一些现有的结论和标准,根据这些给出用户一个初步的解读。 

而互联网模式的优势,则是可以不断通过与已经测过DNA的用户互动,获得更多数据,再据此去做算法优化。

各色科技的基因检测算法逻辑

国外的23andMe就是以互联网的产品模式不断获取基因检测用户生活中的表现数据,从2015年起,中国的基因检测公司也开始了互联网产品的转型,让自己的DNA数据库变成活跃的动态数据库,而不是一次性的数据获取诉求。 

目前,各色科技的网站拥有一批反复访问网站,参与线上互动的活跃用户,这是各色数据分析研究的基础。各色网站已经上线了各色人类研究中心版面,他们希望汇聚国内做基因研究的研究者、专家,把这些一线研究人员的项目放在各色科技的网站上,各色的用户也会通过提供研究需要的数据来获得一些返现。郭婷婷希望通过这样的模式让各色科技成为一股推动基因研究的力量。 

专注心理行为领域的DNA解读

DNA数据是非常标准化的数据,只要检出率和准确率达到标准,DNA数据都可以转化成想要的数据模式或适合算法研发的结构,而对DNA数据的解读则远未达到标准化的程度。 

基因对于人的某些表型的预测可以达到非常准确,但某些结果的预测就大打折扣了。例如,对于一个人喝酒是否脸红的预测就可以非常精准,这些都是简单的单个基因决定的生理特点,同样的还有耳垢的干性湿性、是否狐臭等。而如果说一个人的心理特点、疾病特征,这些在基因中涉及的原理非常复杂,可能涉及了几百个基因的突变,此外,环境还给予了影响,这样的预测准确率自然大打折扣。

 

丰富的基因表象

郭婷婷直言,“通过现有的研究很难确定这些性状是由哪些基因决定的,因此所有相关基因结合起来能够达到的预测准确性上限业内还不知道,这个上限只能通过算法和数据的更深度的结合去提高”。

对于目前基因检测数据结果的不确定性,郭婷婷认为,除了单基因罕见遗传病,在复杂的疾病诊断上,例如癌症、心血管疾病、糖尿病等,还不合适使用基因检测的结论去做出重大医疗决定。例如,安吉丽娜朱莉因为家族遗传的乳腺癌发病率较高,就切掉了两侧的乳腺。但如果严格来说,通过基因检测获得的结果,安吉丽娜朱莉患乳腺癌的几率是79%,那另外的那21%代表着未来有可能不会患乳腺癌。做出手术决定,需要充分与遗传咨询师和医生讨论,也需要了解相应的风险。

人的生活习惯、环境对于生活中的实际表现存在很大影响,因此基因检测在复杂疾病预测这个角度上,存在着太多的不确定性。 

相比于疾病的基因诊断,心理学和认知神经科学背景出身的郭婷婷认为DNA解读也是一种帮助人们了解自我的工具。一方面,抑郁症、双相障碍等心理疾病所导致的悲剧频发;另一方面,心理健康问题对个人,家庭及社会带来的严重影响其实远未得到足够的重视。许多人并不了解的是,心理特征是与遗传高度相关的领域。 

在心理健康、认知能力和性格等心理学特征上,基因可以影响的范围在40%到60%之间,基因与环境的协同作用,塑造了各色各样的人。从表型标注的复杂程度来看,对疾病的判断标准相对容易,而对心理特点的判断则需要专业的测评工具,乃至多个时间段的长期追踪。在中国,他们是第一个把专业的心理测评与基因检测结合起来的公司。最能形成竞争壁垒的是心理学和认识神经学跨领域的专业人才,而从一开始就定位清晰的各色,很显然聚集了各个领域内最好的研究者。 

目前各色通过DNA数据解读用户的先天倾向,用行为测评数据解读用户的现状,通过两者对比结论,帮助用户了解自己的生命轨迹。前者基于DNA研究数据库和文献自行研发的算法,后者则是通过心理学研究通用的标准化量表得出。目前解读的内容包括人格、认知、情绪、社交、成瘾、睡眠等十个主题,祖源产品也即将上线。各色获得用户DNA数据后,通过算法分析为用户出具解读报告,用户可以对报告逐项进行反馈和现状测评,各色根据这些反馈不断提升算法预测准确程度。 

他们通过用户调研发现,针对心理特征的DNA解读,可以有效帮助用户解决与现状相关的心理困惑,提升用户的心理健康水平。“每当有客户在后台告诉我们, 他们变得更加自我接纳了时,团队都特别感动”,郭婷婷说,“我们和用户的关系是相伴相生的,后台数据证明,我们的用户非常活跃,而且转化留存率高于业界平均水平。” 

出色的产品和模式 

各色科技目前已经打造了一个非常流畅的商业运营模式。 

各色科技孵化于著名自媒体大象公会,自然对于互联网和媒体内容驾轻就熟,目前除了各色科技的技术能力打造外,各色的2C产品已经上市数月。 

各色在获取第一部分种子用户的时候,是通过基因检测的内容来吸引的,这是媒体属性的展现。各色同时具备产品研发能力,打造出了一个基因检测套餐,从下单到获得报告都可以在线查看,这是互联网产品的属性,销售产品的通道是网站、有赞、淘宝等电商平台,这又具有了电商属性。

各色的样本采集包 

现在用户在电商平台购买了各色科技的基因检测套餐,就可以收到一个基因采集包,只要在规定的时间内将基因样品寄回各色,最长等待20个工作日,用户可以在各色网站和微信公众号中查看检测进度和最终的基因检测报告,参与各色各种在线互动。 

各色自主开发的互联网检测流程 

对于各色来说,这一套商业模式,是一个完整的技术和产品的闭环。越来越多的用户数据的训练会不断增加技术能力,而产品也同时存在变现的闭环,但这也仅仅是C端产品的探索,对于B端服务的能力,AI和基因检测结合,有望在未来产生更多商业化机会,例如,为公司提供职业生涯咨询,为心理治疗机构提供遗传咨询,为品牌商家提供专业测评等等。 

在各色科技创立之初,就为大象公会的投资人罗永浩的团队做过基因分析,罗永浩提出了工匠精神,各色当时的目标就是去发现,工匠精神和基因是否存在某种关联。虽然这听起来匪夷所思,但基因检测这件事本身就有匪夷所思的属性。 

看目前各色科技的方向和目标,我们虽然看到了各色科技较为出色的商业模式塑造,但就像AI领域的发展一样,数据比算法更重要,能否在这一模式下快速积累高质量数据,将成为未来实现更多可能性的前提。心理健康属于医疗领域中的一个分支,随着社会对于心理健康重视程度的提升,相关的产业也会有越来越多的机会。 

国外的23andMe切入基因领域十几年,已经积累了数百万人的DNA数据,并在基因组领域获得了很多高质量研究成果,目前依然没有实现盈利。对于各色来说,前面的路还很长,这家刚刚过了一年时间的企业,现有的商业模式为未来的产品发展奠定了基础,随着上游测序成本降低与数据积累越来越多,我们期待未来他们可以破译越来越多人类基因组中关于人的性格、喜好、身体特点的秘密。

来源:品途商业评论



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3