❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

ecog

话题找到数量

huggingface/transformers

🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。

160k
33k
600
+50
排名 #13
5月12日
查看详情

ggml-org/whisper.cpp

OpenAI Whisper模型的C/C++移植版本

50k
5.6k
904
+1k
排名 #21
6月1日
查看详情

paperless-ngx/paperless-ngx

社区支持的超级文档管理系统:扫描、索引和归档所有文档

41k
2.8k
423
+611
排名 #12
5月27日
查看详情

opendataloader-project/opendataloader-pdf

面向AI就绪数据的PDF解析器。

24k
2.2k
338
+9.2k
排名 #10
6月7日
查看详情

serengil/deepface

一个轻量级的Python人脸识别与面部属性分析库,支持年龄、性别、情绪和种族识别。

22k
3k
403
+36
排名 #17
2月2日
查看详情

m-bain/whisperX

WhisperX:具备词级时间戳标注的自动语音识别系统

19k
2.1k
419
+17
排名 #9
2月1日
查看详情

antlr/antlr4

ANTLR(语言识别另一工具)是强大的解析器生成器,用于读取、处理、执行或翻译结构化文本及二进制文件。

18k
3.4k
570
+13
排名 #22
5月27日
查看详情

pot-app/pot-desktop

🌈 一款跨平台的划词翻译与OCR软件

18k
907
244
+36
排名 #9
6月4日
查看详情

modelscope/FunASR

端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。

17k
1.8k
461
+705
排名 #19
6月7日
查看详情

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

17k
3.4k
600
+11
排名 #13
5月15日
查看详情

NVIDIA/DeepLearningExamples

按模型组织的尖端深度学习脚本——易于在企业级基础设施上进行训练和部署,并具备可复现的准确性与性能。

14k
3.4k
225
排名 #8
5月16日
查看详情

alphacep/vosk-api

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

14k
1.7k
365
+9
排名 #15
5月30日
查看详情

Anionex/banana-slides

基于nano banana pro🍌的原生AI PPT生成应用,迈向真正的"氛围PPT";支持上传任意模板图片;上传任意素材并智能解析;通过一句话/大纲/页面描述自动生成PPT;口头修改指定区域、一键导出可编辑PPT文件

12k
1.5k
290
+45
排名 #15
2月28日
查看详情

T8RIN/ImageToolbox

🖼️ 图像工具箱是一款支持高级图像处理的强大应用,提供从基础裁剪绘制到滤镜、OCR及多种图像处理功能的数十种特性

12k
528
445
+24
排名 #17
3月21日
查看详情

openvinotoolkit/openvino

OpenVINO™是用于优化和部署AI推理的开源工具套件

10k
3.2k
518
+207
排名 #22
6月9日
查看详情

pyannote/pyannote-audio

说话人日志神经构建模块:语音活动检测、说话人变更检测、重叠语音检测、说话人嵌入

9.9k
1.1k
389
+171
排名 #17
5月1日
查看详情

run-llama/liteparse

一款快速、实用且开源的文件解析工具

9.5k
585
192
+3k
排名 #18
6月7日
查看详情

moonshine-ai/moonshine

面向边缘设备的快速准确自动语音识别

8.2k
431
435
+133
排名 #16
5月24日
查看详情

all-contributors/allcontributors.org

✨ 全贡献者机器人网站与文档。认可所有贡献者,而不仅仅是推送代码的人 ✨

8.1k
1.7k
316
+1
排名 #21
6月5日
查看详情

exadel-inc/CompreFace

领先的免费开源人脸识别系统

7.9k
1.1k
393
+572
排名 #16
5月15日
查看详情

microsoft/presidio

一个用于在文本、图像和结构化数据中检测、编辑、掩码和匿名化敏感数据的开源框架。支持自然语言处理、模式匹配和可定制流水线。

7.8k
1k
244
+50
排名 #16
4月24日
查看详情

Blaizzy/mlx-audio

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

6.3k
493
432
+2k
排名 #13
3月15日
查看详情

argmaxinc/argmax-oss-swift

面向苹果芯片的端侧语音人工智能

6.2k
570
142
+58
排名 #16
6月8日
查看详情

argmaxinc/WhisperKit

适用于Apple Silicon设备的本地语音识别

6k
541
405
+202
排名 #21
4月8日
查看详情
助手