数据挖掘专家,哪些数据分析和数据挖掘的牛人( 九 )


10x开发人员知道使用正确的工具来完成工作,无论是使用库来节省时间,切换语言以实现性能,还是使用API,而不是自己从头构建解决方案 。
比方说你现在有一些Twitter或其他社交数据要用来进行情绪分析 。一个选择是自己标注数据,训练自己的模型,另一个则是使用预先训练的模型 。不去自己建立每个数据模型来重新造轮子是很薄的 。使用最适合工作的工具,即使这意味着使用你没有构建过的工具 。
我们都写过一个与Cron工作配对的Bash脚本来自动化一些报告,但是,在你花费一些时间尝试调试由Cron自动执行的其他人撰写的报告时,你甚至不知道它在哪里运行,你会意识到必须有更好的方法才行 。通过使用自动化工具,如Puppet,Chef,Ansible或任何其他流行的自动化工具,你就可以从集中的位置运行你的工作,因此调试他人(或你自己)的工作就能快很多 。
有时你可能找不到一个团队来负责你设计的模型,这个时候就需要知道如何自己部署自己的模型 。
虽然上面那副图中的提供商之间有很多差异,但它们包含了从难以置信的易用性到你需要的更多的设置和知识 。本节的内容其实可以单独成为一个话题 。如果你想了解有关模型托管的更多细节,可以查看我们的其他几个不同的报告,分别介绍部署模型(网页链接 )以及部署和扩展你的深度学习模型(网页链接) 。
可能是致命伤的事情:
易用性成本(包括附加组件和隐藏成本,如托管数据)投标人锁定语言可用性
通过了解如何部署模型,你才有能力通过数据来讲述故事,轻松地与团队成员共享(不管使用哪种语言)或将其部署到生产环境中,从而与数千用户共享 。这将帮助你成为10x-er,因为一旦了解了这一点,你就可以创建更多性能更高的模型,使用户开心 。当用户开心时,企业主就会开心 。
成为10x数据科学家的技巧
为了让这篇文章圆满,这里有一些关于如何成为10x数据科学家的最受欢迎的技巧:
模式匹配 。这来自于以前遇到类似问题并意识到可以重用或修改当前问题解决方案的经验 。了解如何解释你的代码 - 给自己和其他人 。这意味着你可以在白板上,做/得到代码甚至协同编程 。要习惯于谈论你的代码和思考过程 。了解如何/何时退出并重新开始 。如果你意识到有一个更好的方法来解决问题,那就不要害怕重新开始 。最好就是重新开始,做一个更好的方法来完成,而不是放出一些不是最佳或高性能的东西 。创建你自己的Gists库,或通过GitHub或其他托管服务的存储库组织代码片段 。
最后,回顾整篇帖子,如何成为一个10x的数据科学家和如何调试其实是相同的主题 。每个10x的开发人员都可以想象成一个主调试器,因为这个规则就是无论你的代码多长,你都可以将它乘以10,并得到你需要调试的时间 。成为一个很好的调试器的一个窍门就是使用异常处理,你可以在IDE中使用调试器,你可以通过代码查找逻辑中的错误,并检查涉及错误的库的源代码,以确保你正在传递代码需要的内容 。
即使你从这个帖子只得到了几点收获,恭喜你,你已走上了成为10x数据科学家的道路 。
当然,能不能抵达道路的尽头,就看你自己咯 。
8,你不能不知道的13位中国人工智能女性一年一度的女神节,新智元整理出几位在人工智能领域工作的杰出女性,她们的研究和工作让人工智能更加美好 。
从门禁刷脸到拍照购物再到自动驾驶汽车,人工智能正在以惊人的趋势席卷世界,改变我们的生活 。不过,你或许还不够了解在背后往前推动人工智能的研究人员和科学家,尤其是女性研究员和科学家 。

推荐阅读