TOE网络卸载 

方案解读

TCP协议的硬件全卸载,降低CPU负载 

利用FPGA并行计算优势,降低网络协议处理延时、提升吞吐量

灵活结合业务数据应用的硬件加速

性能规格

处理延时:100ns

支持1~256条TCP连接 

应用场景

金融高频交易

数据中心

RDMA

方案解读

零拷贝

无需用户空间和内核空间来回复制数据 

内核Bypass

IO(数据)流程绕过内核,即在用户层完成数据的发送和接收,降低对核心资源的消耗 

CPU卸载

硬件处理报文封装与解析,无需远端节点CPU参与通信情况下对内存进行读写 

性能规格

PCIE3.0X16

高达100Gb/s的总吞吐量

支持100Gb/s InfiniBand ROCEv2和以太网适配器 

应用场景

高性能计算(HPC)领域

大型数据中心 

Gzip压缩

特性 

完全自研,拥有知识产权

符合RFC1951/1952协议

支持静态、动态哈夫曼编码

LZ77滑动窗口为32KB

数据总线位宽为128bits 

资源占用 

ALM:163K

Mem:28Mbits

吞吐率

Up to 1.3GB/s @150MHz clock

时延

IP latency约为43us

优化进行中 吞吐率期望达到5GB/s 压缩率期望提升10% 

压缩率 

Average ratio of Calgary is 2.58

测试

Calgary

原始文件 Byte)

RTL压缩后文件 (Byte)

RTL压缩率

bib

111261

46427

2.40 

book1

768771

370624

2.07 

book2

610856

258103

2.37 

geo

102400

71180

1.44 

news

377109

170789

2.21 

obj1

21504

11336

1.90 

obj2

246814

101496

2.43 

paper1

53161

22325

2.38 

paper2

82199

35660

2.33 

paper3

46526

21005

2.21 

paper4

13286

6026

2.20 

paper5

11954

5396

2.22 

paper6

38105

16008

2.38 

pic

513216

85180

6.02 

progc

39611

16098

2.46 

progl

71646

21701

3.30 

progp

49379

15300

3.23 

trans

93695

29721

3.15 

Average ratio of Silesia is 2.50

测试集

Silesia

原大小

压缩后

压缩率

xml

5345280

1257124

4.25 

x-ray

8474240

6624812

1.28 

webster

41458703

15302744

2.71 

sao

7251944

5955100

1.22 

samba

21606400

7229340

2.99 

reymont

6627202

2440124

2.72 

osdb

10085684

5154324

1.96 

ooffice

6152192

3503764

1.76 

nci

33553445

6148748

5.46 

mr

9970564

4242752

2.35 

mozilla

51220480

22364788

2.29 

dickens

10192446

4703184

2.17 

CNN图像解析加速

支持Caffe/Tensorflow开源环境下直接使用,自动解析网络拓扑和权重文件并自动配置FPGA

特有的设计架构,结构清晰,高通用性,支持大多数CNN网络拓扑

特有的数据流优化,非指令架构,DSP工作频率可达600MHz,利用率达到80%,计算效率接近理论值

特有专利定点化技术(专利已获授权),计算结果精度高,无缝对接单精度浮点数据

自主知识产权,从视频输入到推理结果处理,无CPU介入,全套RTL解决方案,可提供国产化方案