AI创业公司优秀开发工具指南火了,还发现了个Jupyter的「杀手」
|
一份AI创业公司最佳「开发工具」指南,火了。 Reddit上,一份来自41家创业公司的调研答案,热度已达471。 ![]() 除了比较流行的开发环境Jupyter以外,还出现了这样一个身影——Deepnote。 ![]() 小团队制作,堪称可挑战「Jupyter Notebook」的Deepnote,目前已经有少数公司在使用了。 ![]() 网友纷纷表示要去试试。 ![]() ![]() 于是进一步吸引了Deepnote开发者亲自过来答疑。 ![]() 所以这究竟是一份怎样的指南?还有哪些其他有意思的开发工具? 调研结果这份调查来自一家轻量工具集成网站neptune.ai,他们采访了41家AI初创公司。 ![]() 调查结果如下: 软件开发设置
机器学习框架
MLOps
具体情况,是这样的。 软件开发设置开发环境是每个团队工作流程的基础,而对于IDE,很多团队都喜欢Jupyter Notebooks和Jupyter Lab及其NB扩展。 ![]() 而有些团队则是使用标准软件开发IDE,提及最多的是Pycharm和VSCode。 使用Pycharm的一家公司Hotelmize称,这是最好的Python IDE。 而使用VSCode的公司则为其正名。
对于使用R语言的团队来说,RStudio是他们最好的选择。 还有一项工具——GitHub。我想这对每个AI团队都是福音,初创公司更是。 调查结果正是如此,GitHub因为其免费、强大的版本控制系统、共享功能,对团队来说都是超级有用的。 对于最流行的编程语言里,Python、R语言上榜,竟还有一个Clojure。 值得一提的是,对于环境/基础设施的设置方面,有一些团队给出了以下建议:
机器学习框架机器学习框架也必不可少。而这一部分,选择的工具有很多。 ![]() 在处理表格数据方面,最多提及的是Pandas。 Sigma Polaris CEO表示,Pandas可能是最有价值的工具之一,尤其是在与外部开发人员合作进行各种项目时。所有的数据以数据框架的形式存在,协作更加流畅,减少了不必要的麻烦。 提到可视化,Matplotlib、Plotly是最多的选择。 还有公司推荐了Dash,它是一个在Plotly图表为基础建立的交互式仪表盘的工具,这对于用户来说更加友好。 对于标准的机器学习问题,大多数团队使用Scikit-Learn和XGBoost,尤其是Scikit-Learn。 iSchoolConnect公司就解释道:
对于深度学习框架而言,PyTorch、Tensorflow+Keras很受团队欢迎。 而在具体的方向上,比如NLP,Huggingface、Spacy、Gensim是常用的工具,CV方面,OpenCV无疑是必需的了。 MLOps类似于DevOps,有人称,MLOps是用于机器学习的DevOps。 MLOps是将模型集成并部署到生产系统中的所有工具。 这包括模型被部署到哪里,如何到达哪里,如何被更大的软件/应用程序访问,如何跟踪ML模型在现实世界中的性能,以及如何对模型进行实时管理和测试。 每个团队针对于自身的不同任务,所使用的工具也不尽相同。 ![]() 调查的结果如下:
总的来说,很多团队用Jupyter进行探索,用Pycharm/VSCode进行开发。 他们都喜欢GitHub,Python语言使用的最多。 对于深度学习框架,他们更喜欢使用Tensorflow、Keras和Pytorch。 值得注意的是,越来越多的人开始使用高级的PyTorch训练框架,如Lightning、Ignite、Catalyst、fastai和Skorch。 在可视化探索方面,人们使用matplotlib, plotly, altair和hiplot。 对于实验跟踪,团队通常使用如TensorBoard、MLflow和Sacred这些的开源软件包。 想要了解更多,传送门在此: https://neptune.ai/blog/tools-libraries-frameworks-methodologies-ml-startups-roundup?utm_source=reddit&utm_medium=post&utm_campaign=blog-tools-libraries-frameworks-methodologies-ml-startups-roundup |
时间:2020-08-09 21:09 来源:可思数据 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。