项目竞品项目
Unstructured-IO/unstructured
轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。
milvus-io/milvus
Milvus是专为可扩展向量近似最近邻搜索打造的高性能云原生向量数据库
qdrant/qdrant
Qdrant - 面向下一代 AI 的高性能大规模向量数据库与向量搜索引擎,亦提供云端版本 https://cloud.qdrant.io/
weaviate/weaviate
Weaviate 是一款开源的向量数据库,能够同时存储对象和向量,既支持向量搜索与结构化过滤相结合,又具备云原生数据库的容错能力和可扩展性。
isl-org/Open3D
Open3D:面向三维数据处理的现代算法库
tracel-ai/burn
Burn是下一代深度学习框架,在灵活性、效率和可移植性方面毫不妥协。
onyx-dot-app/onyx
团队智能聊天 - 想象一下ChatGPT能够访问你团队的独特知识。
deepset-ai/haystack
AI 编排框架,用于构建可定制、生产就绪的 LLM 应用。将组件(模型、向量数据库、文件转换器)连接到可与数据交互的流水线或智能体。凭借高级检索方法,特别适用于构建 RAG、问答系统、语义搜索或对话式聊天机器人
Tencent/WeKnora
基于大语言模型的深度文档理解框架,支持使用 RAG 范式实现语义检索和上下文感知应答。
tensorzero/tensorzero
TensorZero是工业级LLM应用的开源技术栈,整合了LLM网关、可观测性、优化、评估与实验功能。
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
scikit-learn/scikit-learn
scikit-learn:Python机器学习库
typesense/typesense
Algolia + Pinecone 的开源替代方案,比 ElasticSearch 更易用的选择 ⚡ 🔍 ✨ 快速、容错、内存模糊搜索引擎,助您打造愉悦搜索体验
f/prompts.chat
又名Awesome ChatGPT提示词库。分享、发现并收集来自社区的提示词。免费开源——为您的组织提供完全隐私的自托管服务。
huggingface/transformers
🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。
rasbt/LLMs-from-scratch
使用PyTorch从零开始逐步实现类ChatGPT大型语言模型
pathwaycom/llm-app
开箱即用的云端模板,支持RAG、AI流水线及实时数据企业搜索。🐳兼容Docker容器部署。⚡始终与SharePoint、Google Drive、S3、Kafka、PostgreSQL、实时数据API等平台保持同步。
ItzCrazyKns/Vane
Vane是一款基于人工智能的问答引擎。
ItzCrazyKns/Perplexica
Perplexica 是由人工智能驱动的搜索引擎,是 Perplexity AI 的开源替代方案
fastai/fastai
fastai深度学习库
相关项目推荐
karpathy/llm.c
基于纯C/CUDA的简易大语言模型训练
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
deepseek-ai/FlashMLA
FlashMLA: Efficient MLA decoding kernels
HigherOrderCO/HVM
基于Rust的大规模并行最优函数运行时
deepseek-ai/DeepEP
DeepEP:高效的专家并行通信库
deepseek-ai/DeepGEMM
DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核