data-science

共找到 27 个相关项目

microsoft/ML-For-Beginners

12周、26节课、52个测验,面向所有人的经典机器学习课程

83k
20k
79
+40
排名 #17
2月23日
查看详情

apache/superset

Apache Superset 是数据可视化与数据探索平台

70k
16k
118
+24
排名 #17
1月30日
查看详情

scikit-learn/scikit-learn

scikit-learn:Python机器学习库

65k
26k
60
+79
排名 #10
2月19日
查看详情

Asabeneh/30-Days-Of-Python

30天Python编程挑战是一个分步指南,帮助你在30天内学习Python编程语言。这个挑战可能需要超过100天,请按照自己的节奏进行。这些视频也可能有所帮助:https://www.youtube.com/channel/UC7PNRuno1rzYPb1xLa4yktw

56k
10k
53
+91
排名 #8
1月25日
查看详情

pandas-dev/pandas

面向Python的灵活强大数据分析处理库,提供类R数据框的标签化数据结构、统计函数及丰富功能

47k
19k
54
+10
排名 #9
2月21日
查看详情

microsoft/Data-Science-For-Beginners

十周二十课,人人皆可数据科学!

33k
6.9k
71
+2.1k
排名 #10
1月31日
查看详情

fastai/fastbook

以Jupyter Notebook形式发布的fastai书籍。

24k
9.4k
73
+351
排名 #21
2月23日
查看详情

plotly/dash

Data Apps & Dashboards for Python. No JavaScript Required.

24k
2.3k
117
+7
排名 #8
2月15日
查看详情

marimo-team/marimo

面向Python的响应式笔记本——运行可复现实验、使用SQL查询、作为脚本执行、部署为应用程序并通过git进行版本控制。存储为纯Python格式,全部集成于现代化的AI原生编辑器中。

18k
883
82
+37
排名 #12
1月24日
查看详情

stefan-jansen/machine-learning-for-trading

《机器学习与算法交易(第二版)》代码实现

16k
5k
78
+50
排名 #14
2月20日
查看详情

dagster-io/dagster

面向数据资产开发、生产与观测的编排平台

14k
2k
108
+13
排名 #10
2月4日
查看详情

trinodb/trino

Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)

12k
3.5k
79
+9
排名 #23
2月20日
查看详情

OpenRefine/OpenRefine

OpenRefine 是一款免费开源的强大工具,用于处理杂乱数据并实现数据质量提升

11k
2.1k
62
+5
排名 #18
2月9日
查看详情

microsoft/RD-Agent

研发对于提升工业生产力至关重要,尤其在AI时代,其核心聚焦于数据与模型。我们致力于通过R&D-Agent自动化这些高价值的通用研发流程,让人工智能驱动数据驱动的AI研究。🔗https://aka.ms/RD-Agent-Tech-Report

10k
1.3k
65
+359
排名 #7
2月8日
查看详情

autogluon/autogluon

Fast and Accurate ML in 3 Lines of Code

9.9k
1.1k
96
+20
排名 #11
2月12日
查看详情

alexeygrigorev/data-science-interviews

数据科学面试题与答案

9.7k
2.1k
95
+28
排名 #7
2月5日
查看详情

rapidsai/cudf

cuDF - GPU 数据帧库

9.5k
1k
116
+2
排名 #14
2月12日
查看详情

h2oai/h2o-3

H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。

7.5k
2k
31
+1
排名 #16
2月22日
查看详情

evidentlyai/evidently

Evidently 是开源的机器学习和大语言模型可观测性框架。评估、测试并监控任何AI驱动系统或数据流水线。从表格数据到生成式AI,涵盖100多项指标。

7.1k
794
56
+23
排名 #17
2月20日
查看详情

lance-format/lance

面向多模态AI的开放式湖仓格式。仅需两行代码即可从Parquet转换,实现百倍速随机访问、向量索引与数据版本管理。兼容Pandas、DuckDB、Polars、Pyarrow及PyTorch,并持续扩展集成生态。

6k
544
114
+7
排名 #13
2月6日
查看详情

aaronwangy/Data-Science-Cheatsheet

一份实用的五页机器学习速查表,适用于考试复习、面试准备及各类中间需求。

5.3k
756
55
排名 #8
2月9日
查看详情

business-science/ai-data-science-team

一个由AI驱动的数据科学智能体团队,助您以10倍速度完成常见数据科学任务。

4.7k
803
85
+846
排名 #15
2月1日
查看详情

khanhnamle1994/cracking-the-data-science-interview

数据科学/机器学习面试准备:速查表、书籍、问题与作品集合集

4.5k
1.2k
0
+16
排名 #17
2月23日
查看详情

mrdbourke/zero-to-mastery-ml

从零到精通的机器学习与数据科学课程全套教学资料

3.6k
3.7k
72
+19
排名 #17
2月2日
查看详情
助手