• 服务器 RTX4090 版:
• CPU:Intel Xeon 4314 2.4GHz 16C32T*2
• 内存:16*32GB 2666MHz
• 硬盘:8TB NVMe U.2 SSD*2
• GPU:NVidia 4090 24G*2(可扩展至4个GPU)
• 70b推理速度:12tokens/s ,每秒约20个汉字, 支持2~3人同时使用
• 32b推理速度:76tokens/s ,每秒约127个汉字, 支持12~15人同时使用