谁在使用scikit-learn?#

J.P.Morgan <https://www.jpmorgan.com> _#

Scikit-learn是摩根大通Python机器学习工具包不可或缺的一部分。它被广泛用于银行的各个部门,用于分类、预测分析和许多其他机器学习任务。其简单的API、算法的广度和文档的质量结合在一起,使scikit-learn同时非常平易近人且非常强大。

Stephen Simmons,摩根大通雅典娜研究副总裁

../_images/jpmorgan.png

Spotify <https://www.spotify.com> _#

Scikit-learn提供了一个工具箱,其中包含一系列最先进的模型的可靠实现,并可以轻松地将它们插入现有的应用程序中。我们一直在Spotify上使用它进行音乐推荐,我认为这是迄今为止我见过的设计最好的ML包。

Erik Bernhardsson,Spotify音乐发现与机器学习工程经理

../_images/spotify.png

Inria <https://www.inria.fr/> _#

在INRIA,我们使用scikit-learn来支持许多团队的前沿基础研究: Parietal 对于神经成像, Lear 对于计算机视觉, Visages 对于医学图像分析, Privatics 为了安全。该项目是解决学术环境中机器学习的困难应用的绝佳工具,因为它性能优异、用途广泛,而且易于使用且有充分的记录,这使得它非常适合研究生。

Gaël Varoquaux,Pariental研究

../_images/inria.png

betaworks <https://betaworks.com> _#

Betaworks是一家总部位于纽约的初创工作室,致力于开发新产品、发展公司并投资他人。在过去的8年里,我们推出了一些社交数据分析驱动的服务,例如Bitly、Chartbeat、Digg和Scale Model。betaworks数据科学团队始终使用Scikit-learn来执行各种任务。从探索性分析到产品开发,它是我们工具包的重要组成部分。最近的用途包括在 digg's new video recommender system ,还有蓬乔的 dynamic heuristic subspace clustering .

Gilad Lotan,首席数据科学家

../_images/betaworks.png

Hugging Face <https://huggingface.co> _#

在Hugging Face,我们使用NLP和概率模型来生成聊天很有趣的对话人工智能。尽管使用深度神经网络 a few 我们的 NLP tasks ,scikit-learn仍然是我们日常机器学习例行程序的主要内容。界面的易用性和可预测性,以及当您需要时提供的简单数学解释,是杀手级功能。我们在生产中使用各种scikit-learn模型,而且它们在操作上也非常愉快。

Julien Chaumond,首席技术官

../_images/huggingface.png

Evernote <https://evernote.com> _#

构建分类器通常是一个探索数据、选择特征(被认为以某种方式具有预测性的数据属性)、训练模型并最终评估它们的迭代过程。对于其中许多任务,我们依赖于出色的Python scikit-learn包。

Read more <http://blog.evernote.com/tech/2013/01/22/stay-classified/> _

Mark Ayzenshtat,增强智能副总裁

../_images/evernote.png

Télécom ParisTech <https://www.telecom-paristech.fr/> _#

在Telecom ParisTech,scikit-learn用于入门和高级机器学习课程的实践课程和家庭作业。这些课程是为本科生和硕士生开设的。scikit-learn的最大好处是它的快速学习曲线,允许学生快速开始研究有趣和激励性的问题。

亚历山大·格兰福特,助理教授

../_images/telecomparistech.jpg

Booking.com <https://www.booking.com> _#

在Booking.com,我们将机器学习算法用于许多不同的应用程序,例如向客户推荐酒店和目的地、检测欺诈性预订或安排我们的客户服务代理。Scikit-learn是我们在实施预测任务的标准算法时使用的工具之一。它的API和文档非常出色,易于使用。scikit-learn开发人员在将最先进的实现和新算法融入到包中方面做得很好。因此,scikit-learn提供了对广泛算法的便捷访问,并使我们能够轻松找到适合工作的合适工具。

梅兰妮·穆勒,数据科学家

../_images/booking.png

AWeber <https://www.aweber.com/> _#

scikit-learn工具包对于AWeber的数据分析和管理团队来说是不可或缺的。 它让我们可以做一些我们没有时间或资源来完成的令人敬畏的事情。该文档非常出色,允许新工程师快速评估并将许多不同的算法应用于我们的数据。当处理AWeber拥有的大量电子邮件内容时,文本特征提取实用程序非常有用。RandomizedPCA实现以及Pipelning和DeliverUnion使我们能够高效可靠地开发复杂的机器学习算法。

任何有兴趣了解AWeber如何在生产环境中部署scikit-learn的更多信息的人都应该查看AWeber的Michael Becker在PyData Boston上的演讲,网址为https://github.com/mdbecker/pydata_2013。

Michael Becker,软件工程师,数据分析和管理忍者

../_images/aweber.png

Yhat <https://www.yhat.com> _#

一致的API、完整的文档和一流的实现的结合使scikit-learn成为我们最喜欢的Python机器学习包。scikit-learn使任何人都可以使用Python进行高级分析。在Yhat,我们可以轻松将这些模型集成到您的生产应用程序中。从而消除了生产化分析工作时遇到的不必要的开发时间。

Greg Lamp,联合创始人

../_images/yhat.png

Rangespan <http://www.rangespan.com> _#

Python scikit-learn工具包是Rangespan数据科学小组的核心工具。它收集了大量有据可查的模型和算法,使我们的数据科学家团队能够快速、快速地进行原型设计,以找到我们学习问题的正确解决方案。我们发现scikit-learn不仅是原型设计的正确工具,而且其仔细且经过良好测试的实施使我们有信心在生产中运行scikit-learn模型。

Jurgen Van Gael,数据科学总监

../_images/rangespan.png

Birchbox <https://www.birchbox.com> _#

在Birchbox,我们面临着一系列电子商务典型的机器学习问题:产品推荐、用户集群、库存预测、趋势检测等。Scikit-learn让我们实验许多模型,尤其是在新项目的探索阶段:数据可以以一致的方式传递;模型易于保存和重复使用;更新让我们了解模式发现研究界的新进展。Scikit-learn是我们团队的重要工具,以正确的方式用正确的语言构建。

Thierry Bertin-Mahieux,数据科学家

../_images/birchbox.jpg

Bestofmedia Group <http://www.bestofmedia.com> _#

Scikit-learn是Bestofmedia所有机器学习的首选工具包。由于它包含了各种最先进的算法实现,我们将它用于各种任务(例如垃圾邮件打击、广告点击预测、各种排名模型)。在实验室中,它加速了复杂管道的原型设计。在生产中,我可以说,它已被证明足够强大和高效,可以部署到业务关键组件。

Eustache Dimert,首席科学家

../_images/bestofmedia-logo.png

Change.org <https://www.change.org> _#

在change.org,我们在生产系统中自动使用scikit-learn的RandomForestClassifier,以推动每周覆盖全球数百万用户的电子邮件定位。在实验室中,scikit-learn的易用性、性能和所实施的算法的总体多样性已被证明是无价的,为我们提供了一个单一的可靠来源来满足我们的机器学习需求。

Vijay Ramesh,Change.org数据/科学软件工程师

../_images/change-logo.png

PHIMECA Engineering <https://www.phimeca.com/?lang=en> _#

在PHIMECA Engineering,我们使用scikit-learn估计器作为评估昂贵的数字模型(主要但不限于有限元素机械模型)的替代品,以加速我们基于模拟的决策框架中涉及的密集后处理操作。Scikit-learn的fit/predicate API及其高效的交叉验证工具大大简化了选择最适合估计器的任务。我们还在培训课程中使用scikit-learn来说明概念。尽管机器学习的理论显然很复杂,但学员们总是对scikit-learn的易用性印象深刻。

Vincent Dublion,PHIMAECA工程,博士工程师

../_images/phimeca.png

HowAboutWe <http://www.howaboutwe.com/> _#

在HowAboutWe,scikit-learn让我们在分析和生产中实施广泛的机器学习技术,尽管我们的团队很小。 我们使用scikit-learn的分类算法来预测用户行为,使我们能够(例如)在潜在客户在我们网站任职的早期估计来自给定流量源的潜在客户的价值。此外,我们的用户资料主要由非结构化数据(开放式问题的答案)组成,因此我们使用scikit-learn的特征提取和降维工具将这些非结构化数据转化为我们匹配系统的输入。

Daniel Weitzenfeld,HowAboutWe高级数据科学家

../_images/howaboutwe.png

PeerIndex <https://www.brandwatch.com/peerindex-and-brandwatch> _#

在PeerIndex,我们使用科学方法论来构建影响力图--一个独特的数据集,使我们能够识别谁在何种背景下真正有影响力。为此,我们必须解决一系列机器学习和预测建模问题。Scikit-learn已成为我们开发原型和快速进展的主要工具。从预测缺失数据和分类推文到聚集社交媒体用户社区,scikit-learn被证明在各种应用程序中很有用。其非常直观的界面以及与其他Python工具的良好兼容性使其成为我们日常研究工作中不可或缺的工具。

Ferenc Huszar,Peerindex高级数据科学家

../_images/peerindex.png

DataRobot <https://www.datarobot.com> _#

DataRobot正在构建下一代预测分析软件,以提高数据科学家的生产力,而scikit-learn是我们系统不可或缺的一部分。scikit-learn提供的各种机器学习技术与可靠的实现相结合,使其成为Python机器学习的一站式库。此外,其一致的API、经过良好测试的代码和许可许可使我们能够在生产环境中使用它。Scikit-learn确实为我们节省了多年的工作,而我们本需要自己将产品推向市场。

Jeremy Achin,DataRobot Inc.首席执行官兼联合创始人

../_images/datarobot.png

OkCupid <https://www.okcupid.com/> _#

我们在OkCupid使用scikit-learn来评估和改进我们的配对系统。它所具有的一系列功能,特别是预处理实用程序,意味着我们可以将其用于各种项目,并且它的性能足以处理我们需要排序的大量数据。文档也非常全面,这使得该库非常易于使用。

David Koh -OkCupid高级数据科学家

../_images/okcupid.png

Lovely <https://livelovely.com/> _#

在Lovely,我们努力为用户和房源提供最好的公寓市场。从了解用户行为、提高数据质量和检测欺诈,scikit-learn是收集见解、预测建模和改进产品的常规工具。API易于阅读的文档和直观的架构使机器学习对于广泛的Python开发人员来说都是可探索和访问的。我不断建议更多的开发人员和科学家尝试scikit-learn。

Simon Frid -数据科学家,Lovely负责人

../_images/lovely.png

Data Publica <http://www.data-publica.com/> _#

Data Publica为商业和营销团队构建了一个名为C-Radar的新预测销售工具。我们广泛使用scikit-learn通过集群来构建客户细分,并根据过去的合作伙伴关系的成功或失败预测未来客户。由于scikit-learn及其机器学习算法的实施,我们还使用其网站通信对公司进行分类。最终,机器学习使检测传统工具无法看到的弱信号成为可能。由于scikit-learn框架的高质量,所有这些复杂任务都可以以简单直接的方式执行。

Guillaume Lebuary和Samuel Charron - Data Publica的数据科学家

../_images/datapublica.png

Machinalis <https://www.machinalis.com/> _#

Scikit-learn是Machinery所有机器学习项目的基石。它具有一致的API、广泛的算法选择和大量处理样板的辅助工具。我们已经在生产环境中的各种项目中使用了它,包括点击率预测, information extraction ,甚至数羊!

事实上,我们使用它太多了,以至于我们已经开始将常见用例冻结到Python包中,其中一些是开源的,比如 FeatureForge . Scikit-learn用一个词来形容:太棒了。

Rafael Carrascosa,首席开发人员

../_images/machinalis.png

solido <https://www.solidodesign.com/> _#

Scikit-learn正在通过Solido帮助推动摩尔定律。Solido创建了大多数前20名半导体公司和晶圆厂使用的计算机辅助设计工具,用于设计智能手机、汽车等内部的尖端芯片。Scikit-learn有助于为Solido的罕见事件估计、最坏情况验证、优化等算法提供动力。在Solido,我们特别喜欢scikit-learn的高斯过程模型、大规模正规线性回归和分类库。Scikit-learn提高了我们的生产力,因为对于许多机器学习问题,我们不再需要“滚动我们自己的”代码。 This PyData 2014 talk 有详细信息。

Trent McConaghy,Solido Design Automation Inc.创始人

../_images/solido_logo.png

INFONEA <http://www.infonea.com/en/> _#

我们在基于内存的商业智能软件INFONEA®中使用scikit-learn进行快速原型设计和定制数据科学解决方案。作为最先进算法和流水线方法的有据可查且全面的集合,scikit-learn使我们能够提供灵活且可扩展的科学分析解决方案。因此,scikit-learn对于实现数据科学技术在自助业务分析中的强大集成非常有价值。

Thorsten Kranz,数据科学家,Coma Soft AG。

../_images/infonea.jpg

Dataiku <https://www.dataiku.com/> _#

我们的软件数据科学工作室(DSA)使用户能够创建结合的数据服务 ETL 使用机器学习。我们的机器学习模块集成了许多scikit-learn算法。scikit-learn库与决策支持系统的完美集成,因为它为几乎所有业务案例提供了算法。我们的目标是提供一种透明、灵活的工具,使其更容易优化构建数据服务、准备数据和在所有类型的数据上训练机器学习算法等耗时的方面。

Florian Douetteau,Dataiku首席执行官

../_images/dataiku_logo.png

Otto Group <https://ottogroup.com/> _#

在全球五大B2C在线零售商之一Otto Group,我们正在日常工作的各个方面使用scikit-learn,从数据探索到机器学习应用程序的开发,再到这些服务的高效部署。它帮助我们解决从电子商务到物流的机器学习问题。一致的API使我们能够构建 Palladium REST-API framework 并不断提供基于scikit-learn的服务。

Christian Rammig,Otto Group数据科学主管

../_images/ottogroup_logo.png

Zopa <https://zopa.com/> _#

在Zopa是第一个点对点贷款平台,我们广泛使用scikit-learn来运营业务并优化用户体验。它支持我们涉及信用风险、欺诈风险、营销和定价的机器学习模型,并已用于发放至少价值10亿英镑的Zopa贷款。它有很好的记录、功能强大且易于使用。我们感谢它所提供的能力,并感谢它让我们能够实现简单、公平赚钱的使命。

Vlasios Vasileiou,Zopa数据科学主管

../_images/zopa.png

MARS <https://www.mars.com/global> _#

Scikit-Learn是Mars机器学习生态系统的组成部分。无论我们是为宠物食品设计更好的食谱,还是仔细分析我们的可可供应链,Scikit-Learn都被用作快速原型构思并将其带入生产的工具。这使我们能够更好地了解和满足全球消费者的需求。Scikit-Learn功能丰富的工具集易于使用,为我们的员工提供了解决每天面临的业务挑战所需的能力。

Michael Fitzke,玛氏公司下一代技术高级负责人

../_images/mars.png

BNP Paribas Cardif <https://www.bnpparibascardif.com/> _#

BNP Paribas Cardif在其生产中的多个机器学习模型中使用scikit-learn。自2015年以来,我们内部的开发人员和数据科学家社区一直在使用scikit-learn,原因有几个:开发的质量、文档和贡献治理以及贡献社区的庞大规模。我们甚至明确提到在我们的内部模型风险治理中使用scikit-learn的管道,作为我们降低运营风险和过度匹配风险的良好实践之一。作为支持开源软件开发,特别是scikit-learn项目的一种方式,我们决定自2018年La Fondation Inria的scikit-learn联盟成立以来参与该联盟。

Sébastien Conort,BNP Paribas Cardif首席数据科学家

../_images/bnp_paribas_cardif.png