AI技术还能这样用?风投借助它寻找优秀创业公司( 二 )


Motherbrain是如何运作的
Motherbrain结合使用非监督式和监督式深度学习算法 。 非监督式学习算法是在没有任何外部指导的情况下发现数据中的重要模式 。 监督式学习算法需要有标记的训练数据 。 例如,如果训练数据包含被标记为“猫”或“不是猫”的动物的例子,算法就会试图了解猫的特征,从而判断呈现在它面前的新动物是否是猫 。
【AI技术还能这样用?风投借助它寻找优秀创业公司】在风险投资中,数据可以用来对公司进行市场行业归类,这是任何风投公司都要进行的一项基本任务 。 创业公司用来描述自己的文本和其他人对它的行业归类可以在这个过程带来帮助,但那些数据往往是杂乱且相互矛盾的,尤其是对于新兴的技术和行业 。 Motherbrain利用非监督式学习的方法来发现公司的类别 。 然后,EQT Ventures的员工给每个类别中的公司贴上标签——例如,鉴别一个包含区块链公司的类别——然后带标签的数据被用来训练监督式学习算法 。 之后,Motherbrain会自动对新公司进行行业分类 。
“这实际上是一种从非常嘈杂的数据中获得一些有意义的信息的方法 。 ”兰德格林说,“如果你根据嘈杂的数据对模型进行训练,你可以建立更少的类别,从而拥有更好的预测能力 。 ”
公司随着时间推移的演变——以及相关数据指标如何随之发生变化——也是评估过程中的一个重要因素 。 时间序列是一组编入索引的数据点,捕捉了公司的演变过程 。 Motherbrain可以从时间序列数据中学习,根据具有类似指标的公司的表现,预测公司未来将会如何演变 。 “例如,他们融资的速度是快还是慢?”兰德格林指出,“当你将时间序列纳入考虑范围时,网络趋势、应用排名以及所有那些不同的东西实际上会更加有趣 。 ”
兰德格林还为EQT Ventures专门为Motherbrain开发的最先进的数据基础设施感到自豪 。 他有个由5人组成的专门开发团队与谷歌密切合作,采用Kafka、Kubernetes、Google BigQuery和BigTable等技术 。
“开发人员在工作时,会不断地发现自己遇到些还没有人问过的问题 。 ”兰德格林称,“然后你会觉得坐立不安 。 我们正在构建一个人工智能决策平台,用于帮助作出涉及人类和大量数据集的决策 。 我认为这种结合相当新颖 。 我们正走在前沿位置 。 ”
大数据,大问题
Motherbrain远非完美无缺 。 就像任何的机器学习系统一样,它的预测好坏完全取决于训练数据的好坏,而且数据总是不完整的,有时甚至完全不准确 。 兰德格林说,“我们确实有看到一些没有数据记录的公司——它们处于‘隐身’模式——即使是Motherbrain也看不到它们,所以这将会是一个问题 。 ”
通过将多个数据源拼接在一起,EQT Ventures试图增加系统的覆盖范围和不同数据源之间的重叠 。 由于该公司的投资者每天都在使用Motherbrain,他们可以在发现数据源之间的差异时纠正它们 。
兰德格林也热衷于强调,Motherbrain离做出最后的投资决定还有很长的路要走 。 “打造让你能够找到优秀公司的模型当然是好事,但这并不意味着你只需按下一个按钮就能知道该投资谁 。 ”兰德格林表示,“这需要做更多别的工作,其中很大一部分就是像传统投资者那样去建立关系 。 关键是要知道建立什么样的关系以及何时建立 。 这就是我们使用Motherbrain的目的 。 ”(乐邦)

推荐阅读