Home
产品展示
极进交换机
极进AP
新闻中心
解决方案
关于我们
联系我们
Home
产品展示
极进交换机
极进AP
新闻中心
解决方案
关于我们
联系我们
新闻中心
HOME
>
新闻中心
TensorRT-LLM 低精度推理优化:从速度和精度角度的 FP8 vs INT8 的全面解析
2025-01-13
本文将分享 TensorRT-LLM 中低精度量化内容,并从精度和速度角度对比 FP8 与 INT8。
借助视觉问答和多模态检索推进神经科学研究
2025-01-13
领先的医疗健康组织正在转向生成式 AI,以帮助构建能够带来挽救生命影响的应用。
使用 EMBark 加速大规模推荐系统嵌入式训练优化
2025-01-13
推荐系统是互联网行业的核心,而高效地训练这些系统对于各大公司来说是一个关键问题。
MONAI 成立 5 周年,庆祝开放科学和企业 AI 创新
2025-01-13
值此 MONAI 成立五周年之际,我们见证了开放式医疗 AI 愿景与生产就绪型企业解决方案的融合。
统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持
2025-01-10
cuDF-pandas 是一个 GPU 加速库,可加速 pandas 以实现显著的性能提升,速度最高可提升至原来的 50 倍,而无需对现有代码进行任何更改。
使用 NVIDIA Nsight Graphics 优化图形应用的 GPU 工作负载
2025-01-10
图形开发者和发烧友的一大消遣方式是比较 GPU 的规格,并惊叹于每一代新一代产品中着色器核心、RT 核心、万亿次浮点运算能力和整体计算能力的不断增加。
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
2025-01-10
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。
NVIDIA CUDA-Q 在 Infleqtion QPU 上运行突破性逻辑 Qubit 应用
2025-01-10
Infleqtion 是中性原子量子计算领域的全球领导者,他们首先使用 NVIDIA CUDA-Q 平台在其 Sqale 物理量子处理器 (QPU) 上进行模拟,然后编排逻辑量子位材料科学实验的首次演
开发具有高效数据存储的多语种和跨语言信息检索系统
2025-01-09
高效的文本检索对于搜索、问答、语义文本相似性、摘要和商品推荐等各种信息检索应用至关重要。
NVIDIA Jetson Orin Nano 开发者套件得到“超级”提升
2025-01-09
生成式 AI 格局正在迅速发展,新的 大语言模型 (LLMs)、视觉语言模型 (VLMs) 和视觉语言动作 (VLAs) 模型每天都在涌现。
首页
···
28
29
30
31
32
···
30/34
尾页