产品展示

极进交换机

新闻中心

解决方案

关于我们

联系我们

新闻中心

HOME > 新闻中心

TensorRT-LLM 低精度推理优化：从速度和精度角度的 FP8 vs INT8 的全面解析

TensorRT-LLM 低精度推理优化：从速度和精度角度的 FP8 vs INT8 的全面解析

2025-01-13

本文将分享 TensorRT-LLM 中低精度量化内容，并从精度和速度角度对比 FP8 与 INT8。

借助视觉问答和多模态检索推进神经科学研究

借助视觉问答和多模态检索推进神经科学研究

2025-01-13

领先的医疗健康组织正在转向生成式 AI，以帮助构建能够带来挽救生命影响的应用。

使用 EMBark 加速大规模推荐系统嵌入式训练优化

使用 EMBark 加速大规模推荐系统嵌入式训练优化

2025-01-13

推荐系统是互联网行业的核心，而高效地训练这些系统对于各大公司来说是一个关键问题。

MONAI 成立 5 周年，庆祝开放科学和企业 AI 创新

MONAI 成立 5 周年，庆祝开放科学和企业 AI 创新

2025-01-13

值此 MONAI 成立五周年之际，我们见证了开放式医疗 AI 愿景与生产就绪型企业解决方案的融合。

统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持

统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持

2025-01-10

cuDF-pandas 是一个 GPU 加速库，可加速 pandas 以实现显著的性能提升，速度最高可提升至原来的 50 倍，而无需对现有代码进行任何更改。

使用 NVIDIA Nsight Graphics 优化图形应用的 GPU 工作负载

使用 NVIDIA Nsight Graphics 优化图形应用的 GPU 工作负载

2025-01-10

图形开发者和发烧友的一大消遣方式是比较 GPU 的规格，并惊叹于每一代新一代产品中着色器核心、RT 核心、万亿次浮点运算能力和整体计算能力的不断增加。

聚焦：Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求

聚焦：Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求

2025-01-10

对 AI 赋能服务的需求持续快速增长，这给 IT 和基础设施团队带来了越来越大的压力。

NVIDIA CUDA-Q 在 Infleqtion QPU 上运行突破性逻辑 Qubit 应用

NVIDIA CUDA-Q 在 Infleqtion QPU 上运行突破性逻辑 Qubit 应用

2025-01-10

Infleqtion 是中性原子量子计算领域的全球领导者，他们首先使用 NVIDIA CUDA-Q 平台在其 Sqale 物理量子处理器 (QPU) 上进行模拟，然后编排逻辑量子位材料科学实验的首次演

开发具有高效数据存储的多语种和跨语言信息检索系统

开发具有高效数据存储的多语种和跨语言信息检索系统

2025-01-09

高效的文本检索对于搜索、问答、语义文本相似性、摘要和商品推荐等各种信息检索应用至关重要。

NVIDIA Jetson Orin Nano 开发者套件得到“超级”提升

NVIDIA Jetson Orin Nano 开发者套件得到“超级”提升

2025-01-09

生成式 AI 格局正在迅速发展，新的大语言模型 (LLMs)、视觉语言模型 (VLMs) 和视觉语言动作 (VLAs) 模型每天都在涌现。

首页 ···28 29 30 31 32··· 30/34 尾页

联系我们

地址：北京市-海淀区-上地信息路7号昊海大厦306室

电话： 4001616691

邮箱： liying@itzkxy.com

产品展示

极进交换机极进AP

扫码关注微信公众号

服务热线:4001616691

京ICP备19012332号-1