行业
- 农业/生物科技
位置
- 总部:圣. 路易斯,莫
用例
- 永利贵宾会和作物产量优化
- 客户细分和流失预测
- 供应链效率
影响
- 显著提高供应链种子产量
- 具有不同技能和工具选择的不同团队之间的协作
- 通过数字解决方案实现重大价值
用户
- 500强数据科学社区嵌入多个全球业务线
解决方案
- 数据科学工具:R Studio, Python, 瓶, Shiny
- 服务器/云基础设施:AWS
拜耳的数据科学
其历史可以追溯到一个多世纪以前, 拜耳一直将创新视为实现其使命的关键,即提高农民的收成,平衡人类的需求与地球有限的资源. 拜耳, 世界领先的农永利贵宾会供应商, 以数据科学为核心, 支持用例,例如最大化作物产量, 改善客户体验, 优化供应链运作. 数据科学的输出是一个模型. 由拜耳500多家强大的数据科学社区建立的模型帮助改进了100多项决策, 该公司体现了什么是模型驱动.
拜耳已经采用Domino作为其“science@scale”数据科学平台的一部分,以进一步增强可见性和协作, 加快数百个同时进行的项目和多个业务部门的研究步伐. 该平台正在对业务产生重大影响. 再加上对企业范围的数据战略和数字平台的投资, 通过降低永利贵宾会成本和提高运营效率,拜耳实现了显著的成本节约.
机会
拜耳有一个多年的研究管道来开发新永利贵宾会, 包括能够最大限度地提高作物产量、防止虫害和除草剂的种子,这些种子是对抗田地里破坏产量的杂草所必需的. The process is expensive and time-consuming; there is little margin for error.
“每年, 在每个半球的生长季节,永利贵宾会有一次机会收集永利贵宾会培育的种子的数据,纳文·辛格拉解释道, 拜耳数据科学卓越中心负责人. “永利贵宾会管理着大量的数据,以帮助产生高质量的结果, 但永利贵宾会也知道,总是有机会改进永利贵宾会管理和利用数据的方式.”
该公司在农业生产过程的每个阶段都应用了高度复杂的模型, 从早期育种到田间测试, 提高突破的可能性和速度,在节约环境资源的同时实现产量最大化.
拜耳在他们的数据科学之旅的早期就意识到管理开发, 生产, 对模型的持续改进需要一种不同于围绕软件工程和数据管理的既定学科的方法. 拜耳开始发展内部, 基于云的数据科学平台,称为“science@scale”,用于摄取数据并提供对广泛使用的数据科学工具的访问. 同时该平台加快了数据分析的速度, 模型的独特特性需要额外的协作.
模型的构建方式不同,它们服务于不同的目的.
不像软件工程或数据管理, 模型(以及拜耳的业务)需要一种基于研究的方法,包括不断的探索, 迭代, 和敏捷性. 它们是概率性的,而不是确定性的. The nature of data scientists’ work is experimental and collaborative; models must constantly be tracked, 重新训练, 并不断迭代,以反映不断变化的数据和其他导致模型漂移的因素.
拜耳有机会扩大其基于研究的方法,在其全球数据科学社区取得更大的成功.
模型有不同的成分.
数据科学工具和技术的前景——i.e. 进入模型的“成分”是非常异构的,并且不断发展. 数据科学平台必须提供灵活性, 敏捷性, 以及支持动态工具环境和多样化技能集和偏好的可伸缩性. 快速迭代再训练模型的能力, 验证, 部署对拜耳来说是“必须的”.
science@scale解决方案包括RStudio, Jupyter, 瓶等.,迎合熟悉现代软件编程范式的数据科学家. Domino为拜耳更广泛的数据科学社区提供了访问大数据技术堆栈的更便捷的途径, 这对拜耳多元化的研究团队产生了积极影响,同时也带来了商业价值.
“永利贵宾会需要一个可以抽象出复杂性的平台,允许所有用户进行大规模的分析, 利用现代技术栈,从数据中获得更好的见解,辛格拉说。.
多米诺效应
拜耳领导层认识到与多米诺加强science@scale合作的机会. Domino是一个专门构建的数据科学平台,支持多种工具, 自动化硬件基础设施配置(因此数据科学家可以并行和大规模地运行实验), 并且促进了模型的快速迭代和部署. Domino提供的关键特性包括:
- 开放和灵活的易用性:Domino使拜耳的数百名数据科学家能够专注于推动创新, 使用他们喜欢的硬件, 软件, 工具, 和语言——包括RStudio, Python, 瓶, 和Shiny——集中管理. 该平台允许相对不熟悉大数据技术栈的团队成员进行处理, 探索, 并使用最新的软件包建模数据. 每个级别的数据科学家都有权控制自己的环境和硬件.
- 协作:Domino不仅会自动对代码进行版本化, 而是整个实验和数据, 的环境, 讨论线程, 和必要的工件, 这意味着工作永远不会丢失,并且总是可复制的. “能够将你目前的结果与以前的五个实验中的一个进行比较,看看有什么变化,这是非常宝贵的,辛格拉说。. 全球的数据科学家可以在过去的工作基础上进行合作,而不是重新发明轮子, 数据科学领导对团队高效、大规模交付业务结果的能力充满信心.
- 采用:拜耳在science@scale的健壮的发现环境中设置Domino, 通过Domino API和Shiny应用程序加速模型开发和模型交付. 在该公司的500多名数据科学家社区中,超过75%的人现在积极地使用Domino,并且采用还在继续扩大. 随着团队的成长, 专家级数据科学家在Domino中创建模板,帮助更多的初级同事深入了解和分享最佳实践.
拜耳的数据科学之旅:使命驱动
拜耳的大型数据科学社区是一个有凝聚力、高绩效的团队. 他们建立的模型既能推动农业突破,又能优化日常商业运作的效率.
全公司的数字创新, 通过对数据的投资组合来实现, 平台, 和人民, 带领公司实现了向世界各地的农民提供农永利贵宾会的价值和效率.
- 通过多米诺平台使用机器学习, 拜耳更能理解, 建立模型并预测种子遗传的影响, 环境条件和农艺实践对其供应链操作中的作物产量的影响. 产量表现取决于作物基因型和环境因素(如地形)之间的相互作用, 作物种植地的土壤和气候条件). 利用该平台,只需在公司现有种子生产网络的最佳区域种植永利贵宾会,就可以显著提高种子生产产量. 这种增加可以用来减少生产面积, 或者是现有生产面积的不确定性.
- 而不是在在线操作中使用静态模型, 研究人员现在可以根据更新的数据流调整模型. 快速迭代, 验证, 使用Domino的交付使他们能够更有效地进行现场操作.
- Domino允许拜耳的销售团队访问有关客户特定需求的更详细的信息, 以便为他们的领域推荐最好的永利贵宾会. 这种个性化的方法提高了客户的成功和满意度.
- 该平台自动跟踪R的完整测试记录&D项目, 并将其部署为api,供下游系统使用, 允许加入团队的新成员立即做出贡献.
“Domino为全球企业的用户提供了更方便的服务, 使用不同的工具,拥有不同的背景和技能, 相互合作, 利用过去的工作成果, 快速合作. 这最终导致在更短的时间内交付和部署更多的模型, 是什么让拜耳成为一家模型驱动型公司,走在农业的前沿,辛格拉说。.