谁在使用scikit-learn?#
J.P.Morgan <https://www.jpmorgan.com> _#
Spotify <https://www.spotify.com> _#
Inria <https://www.inria.fr/> _#
betaworks <https://betaworks.com> _#
Betaworks是一家总部位于纽约的初创工作室,致力于开发新产品、发展公司并投资他人。在过去的8年里,我们推出了一些社交数据分析驱动的服务,例如Bitly、Chartbeat、Digg和Scale Model。betaworks数据科学团队始终使用Scikit-learn来执行各种任务。从探索性分析到产品开发,它是我们工具包的重要组成部分。最近的用途包括在 digg's new video recommender system ,还有蓬乔的 dynamic heuristic subspace clustering .
Gilad Lotan,首席数据科学家
Hugging Face <https://huggingface.co> _#
Evernote <https://evernote.com> _#
Télécom ParisTech <https://www.telecom-paristech.fr/> _#
Booking.com <https://www.booking.com> _#
AWeber <https://www.aweber.com/> _#
scikit-learn工具包对于AWeber的数据分析和管理团队来说是不可或缺的。 它让我们可以做一些我们没有时间或资源来完成的令人敬畏的事情。该文档非常出色,允许新工程师快速评估并将许多不同的算法应用于我们的数据。当处理AWeber拥有的大量电子邮件内容时,文本特征提取实用程序非常有用。RandomizedPCA实现以及Pipelning和DeliverUnion使我们能够高效可靠地开发复杂的机器学习算法。
任何有兴趣了解AWeber如何在生产环境中部署scikit-learn的更多信息的人都应该查看AWeber的Michael Becker在PyData Boston上的演讲,网址为https://github.com/mdbecker/pydata_2013。
Michael Becker,软件工程师,数据分析和管理忍者
Yhat <https://www.yhat.com> _#
Rangespan <http://www.rangespan.com> _#
Birchbox <https://www.birchbox.com> _#
Bestofmedia Group <http://www.bestofmedia.com> _#
Change.org <https://www.change.org> _#
PHIMECA Engineering <https://www.phimeca.com/?lang=en> _#
HowAboutWe <http://www.howaboutwe.com/> _#
PeerIndex <https://www.brandwatch.com/peerindex-and-brandwatch> _#
DataRobot <https://www.datarobot.com> _#
OkCupid <https://www.okcupid.com/> _#
Lovely <https://livelovely.com/> _#
Data Publica <http://www.data-publica.com/> _#
Machinalis <https://www.machinalis.com/> _#
Scikit-learn是Machinery所有机器学习项目的基石。它具有一致的API、广泛的算法选择和大量处理样板的辅助工具。我们已经在生产环境中的各种项目中使用了它,包括点击率预测, information extraction ,甚至数羊!
事实上,我们使用它太多了,以至于我们已经开始将常见用例冻结到Python包中,其中一些是开源的,比如 FeatureForge . Scikit-learn用一个词来形容:太棒了。
Rafael Carrascosa,首席开发人员
solido <https://www.solidodesign.com/> _#
Scikit-learn正在通过Solido帮助推动摩尔定律。Solido创建了大多数前20名半导体公司和晶圆厂使用的计算机辅助设计工具,用于设计智能手机、汽车等内部的尖端芯片。Scikit-learn有助于为Solido的罕见事件估计、最坏情况验证、优化等算法提供动力。在Solido,我们特别喜欢scikit-learn的高斯过程模型、大规模正规线性回归和分类库。Scikit-learn提高了我们的生产力,因为对于许多机器学习问题,我们不再需要“滚动我们自己的”代码。 This PyData 2014 talk 有详细信息。
Trent McConaghy,Solido Design Automation Inc.创始人
INFONEA <http://www.infonea.com/en/> _#
Dataiku <https://www.dataiku.com/> _#
我们的软件数据科学工作室(DSA)使用户能够创建结合的数据服务 ETL 使用机器学习。我们的机器学习模块集成了许多scikit-learn算法。scikit-learn库与决策支持系统的完美集成,因为它为几乎所有业务案例提供了算法。我们的目标是提供一种透明、灵活的工具,使其更容易优化构建数据服务、准备数据和在所有类型的数据上训练机器学习算法等耗时的方面。
Florian Douetteau,Dataiku首席执行官
Otto Group <https://ottogroup.com/> _#
在全球五大B2C在线零售商之一Otto Group,我们正在日常工作的各个方面使用scikit-learn,从数据探索到机器学习应用程序的开发,再到这些服务的高效部署。它帮助我们解决从电子商务到物流的机器学习问题。一致的API使我们能够构建 Palladium REST-API framework 并不断提供基于scikit-learn的服务。
Christian Rammig,Otto Group数据科学主管
Zopa <https://zopa.com/> _#
MARS <https://www.mars.com/global> _#
BNP Paribas Cardif <https://www.bnpparibascardif.com/> _#
BNP Paribas Cardif在其生产中的多个机器学习模型中使用scikit-learn。自2015年以来,我们内部的开发人员和数据科学家社区一直在使用scikit-learn,原因有几个:开发的质量、文档和贡献治理以及贡献社区的庞大规模。我们甚至明确提到在我们的内部模型风险治理中使用scikit-learn的管道,作为我们降低运营风险和过度匹配风险的良好实践之一。作为支持开源软件开发,特别是scikit-learn项目的一种方式,我们决定自2018年La Fondation Inria的scikit-learn联盟成立以来参与该联盟。
Sébastien Conort,BNP Paribas Cardif首席数据科学家




























