• 数字信号处理-11-FPGA FFT IP应用实例


    前言

    本文根据FFT相关原理进行设计构建工程,仿造前文的工程构建的混频功能的工程,设计工程显示该混频信号的功率谱,然后进行仿真分析。

    FFT仿真与分析

    本文不再针对FFT的原理进行过多赘述,提供一份简单的matlab仿真代码。根据仿真简述下FFT的相关使用注意事项。

    clc;clear all;
    fs=50e6;%采样率
    N=1024;%采样点数
    t=[0:N-1]/fs; %时间序列
    f1=3e6;%频点1 3MHZ
    f2=4e6;%频点2 4MHZ
    s1=sin(2*pi*f1*t);%信号1
    s2=sin(2*pi*f2*t);%信号2
    mixsign=s1.*s2;%混频
    fftsign=fft(mixsign);%求fft
    fftabs=abs(fftsign);%取模运算
    plot(fftabs);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    代码设计,模拟生成了两个不同频率的信号3MHz和4MHz,模拟采样了1024,将两个信号进行混频后则产生了7MHz和1MHz的信号。然后通过FFT函数,取模运算,求得FFT的幅度谱,然后进行显示输出。

    1024点的FFT结果

    频率分辨率

    频率分辨率是FFT的一个重要的参数,横坐标每一个单位的频率精度等于 fs/N,N 是 FFT 的点数。即求出该仿真情况下的频率分辨率如下:
    50 M H z 1024   = 48828.125 H z \frac {50MHz}{1024}\ = 48828.125Hz 102450MHz =48828.125Hz
    将仿真输出的图片放大,并标注坐标,可见,第一个峰值的横坐标为21,第二个峰值的横坐标为144,计算可知,第一个峰值对应的频率为1.0254MHz,第二个峰值对应的频率为1.0254MHz,7.0313MHz。

    FFT结果

    可见实际FFT出来后的结果,和仿真设置的相差了一点,但是基本上是在设置的附近,这是因为频率分辨率不够,48828.125Hz的分辨率不能恰好对应到设置的1MHz和7MHz。

    如果想恰好得到1MHz和7MHz的FFT的处理结果,或者想进一步减小误差,则需要进行相干采样,频率分辨率恰好是所求的频率的倍数。

    关于频谱泄露

    频率分辨率欠佳后,就会造成频谱泄露。

    当信号X(t)的频率f0是fs/N的整数倍时,这说明在处理长度NT内有信号的K个整周期。这时由X(t)构成的以NT为周期的周期性信号是连续的。当信号X(t)的频率f0不是fs/N的整数倍时,则在NT的处理长度内,就不是恰好为信号周期的整数倍,有X(t)以NT为周期进行周期延拓所得到的周期性信号就出现了不连续点,造成了频谱分量从其正常频谱扩展开来,就这样形成了频谱泄露现象。

    整周期截断,不会造成频谱泄露;非整周期截断,必然造成频谱泄露。

    前面提到的相干采样,正式因为进行了整数周期的截断才使得频谱不进行泄露,并且FFT后的信号尖峰也恰好能对应我们设置的预期的频率。

    使用FFT IP进行工程设计

    可以将DDS应用实例的工程进行复制备份,然后添加相关 IP,进行工程适配。

    实现功率谱逻辑

    FFT 的原理是可以通过实部和虚部的数据恢复出周期信号的相位和幅值; 假如 a 是实部数据, b 是虚部数据, a+bj 是复数;对应的模运算是=sqrt(a2+b2),FFT处理后取模运算中的开更号在FPGA中实现比较麻烦,可以利用自带的cordic IP去处理,这里可以简化一下求FFT处理后的功率谱,也即(a2+b2)。

    因此在调用FFT函数后,将输出的数据的实部虚部进行平方再相加即可得到FFT处理后的功率谱。

    添加FFT IP

    在配置界面可配置FFT的通道个数,傅里叶变换的长度,该结构的时钟,以及采用的算法架构。改变通道个数为N后,对应的数据位宽会变成一个通道的N倍。这里设置 IP 核 1024 点 FFT, 采样率 50MHz, 选择基 2 突发结构。

    FFT IP配置

    数据格式选择定点数类型,放缩设置为块浮点模式, 输出 FFT 结果选择顺序输出。

    FFT ip配置二

    在侧边栏可以看到IP的接口状态,以及具体实现架构的相关细节,从实现细节界面可看到,在CONFIG接口处的数据位,有一个FWD_INV的配置参数,该参数是配置正变换还是反变换,因为 FFT 的计算正变换和反变换可以用一套算法实现。 这里 FWD_INV=1 为正变换, 为 0 是反变换。

    这里看到 CHAN_0_XN_IM_0(31:16)是复数的虚部数据,并且使用的是 fix16_15 定点数, 意思是最高位为符号位, 小数部分有15位。CHAN_0_XN_RE_0(15:0)是复数的实部数据;这里的FFT混频信号只提供了实部的信号,因此,在信号连接时,只需要把低 16 位赋值为乘法器输出值, 而高 16 位赋值为 0即可。

    FFT侧边栏

    从侧边栏还可以对FFT进行延时分析,从图中可知,该架构的FFT变化需要146.820us才能完成。

    延时分析

    添加DDS IP

    添加DDS IP,配置输出两路信号分别为3MHz和4MHz。匹配FFT的IP采样频率的50MHz,修改SFDR为45。

    DDS ip配置

    配置完成基本信息配置下一页,基本保持默认即可,这里只想查看波形,所以相位输出就关闭。

    配置界面二

    DDS的IP核多通道之间是分时复用的,所以在细节实现配置界面最好使能通道ID以供进行区别单个通道的信号波形。其余可以保持默认。

    使能通道ID

    配置输出频率为3MHz和4MHz。其余保持默认,点击OK,完成配置。

    配置输出频率

    修改乘法器IP

    将乘法器适配当前的数据位宽,并保存设置。该乘法器用于实现混频乘法。

    乘法器配置

    调用第二个乘法器,配置输入位宽为16位,输出为32位,有符号类型。该乘法器用于实现FFT处理后的功率谱逻辑。

    image-20221128132020847

    编写.V文件

    根据上面的逻辑结构,例化IP、编写代码依次实现DDS的信号产生、混频、FFT处理、以及功率谱运算逻辑。

    `timescale 1ns / 1ps
    module top(
        input clk
        );
    
        wire          m_axis_data_tvalid_ch3;
        wire [7 : 0]  m_axis_data_tdata_ch3;
        wire [0 : 0]  m_axis_data_tuser_ch3;
    
        //多通道测试
        dds_compiler_1 multi_ch_dds(
        .aclk(clk),                                // input wire aclk
        .m_axis_data_tvalid(m_axis_data_tvalid_ch3),    // output wire m_axis_data_tvalid
        .m_axis_data_tdata(m_axis_data_tdata_ch3),      // output wire [7 : 0] m_axis_data_tdata
        .m_axis_data_tuser(m_axis_data_tuser_ch3)
        );
    
        reg [7 : 0] data3MHz;
        reg [7 : 0] data4MHz;
        always @(posedge clk) begin
            case(m_axis_data_tuser_ch3)
                0:data3MHz<=m_axis_data_tdata_ch3;
                1:data4MHz<=m_axis_data_tdata_ch3;
            endcase
         end
    
        //混频测试
        wire [15 : 0]  mixer_singal;
        mult_gen_0 mult_mixer (
            .CLK(clk),  // input wire CLK
            .A(data3MHz),      // input wire [7 : 0] A
            .B(data4MHz),      // input wire [7 : 0] B
            .P(mixer_singal)      // output wire [15 : 0] P
        );
    
        reg div_clk=0;
        always @(posedge clk ) begin
            div_clk<=!div_clk;
        end
    
        wire mixer_singal_tready;
        wire [31 : 0] after_fft_data;
        wire [7 : 0] m_axis_data_tuser;
        wire m_axis_data_tvalid;
    
        xfft_0 uut_fft(
        .aclk(div_clk),                                                // input wire aclk
        .s_axis_config_tdata('d1),                  // input wire [7 : 0] s_axis_config_tdata
        .s_axis_config_tvalid(1),                // input wire s_axis_config_tvalid
        .s_axis_config_tready(),                // output wire s_axis_config_tready
        .s_axis_data_tdata({16'd0,mixer_singal}),                      // input wire [31 : 0] s_axis_data_tdata
        .s_axis_data_tvalid(1),                    // input wire s_axis_data_tvalid
        .s_axis_data_tready(mixer_singal_tready),                    // output wire s_axis_data_tready
        .s_axis_data_tlast(0),                      // input wire s_axis_data_tlast
        .m_axis_data_tdata(after_fft_data),                      // output wire [31 : 0] m_axis_data_tdata
        .m_axis_data_tuser(m_axis_data_tuser),                      // output wire [7 : 0] m_axis_data_tuser
        .m_axis_data_tvalid(m_axis_data_tvalid),                    // output wire m_axis_data_tvalid
        .m_axis_data_tready(1),                    // input wire m_axis_data_tready
        .m_axis_data_tlast(),                      // output wire m_axis_data_tlast
        .m_axis_status_tdata(),                  // output wire [7 : 0] m_axis_status_tdata
        .m_axis_status_tvalid(),                // output wire m_axis_status_tvalid
        .m_axis_status_tready(1),                // input wire m_axis_status_tready
        .event_frame_started(),                  // output wire event_frame_started
        .event_tlast_unexpected(),            // output wire event_tlast_unexpected
        .event_tlast_missing(),                  // output wire event_tlast_missing
        .event_status_channel_halt(),      // output wire event_status_channel_halt
        .event_data_in_channel_halt(),    // output wire event_data_in_channel_halt
        .event_data_out_channel_halt()  // output wire event_data_out_channel_halt
        );
        
        wire [31 : 0] fft_re_2;
        mult_gen_1 mult_re (
            .CLK(div_clk),  // input wire CLK
            .A(after_fft_data[15:0]),      // input wire [15 : 0] A
            .B(after_fft_data[15:0]),      // input wire [15 : 0] B
            .P(fft_re_2)      // output wire [31 : 0] P
        );
    
        wire [31 : 0] fft_im_2;
        mult_gen_1 mult_im (
            .CLK(div_clk),  // input wire CLK
            .A(after_fft_data[31:16]),      // input wire [15 : 0] A
            .B(after_fft_data[31:16]),      // input wire [15 : 0] B
            .P(fft_im_2)      // output wire [31 : 0] P
        );
    
        wire [32 : 0] sum = fft_re_2 + fft_im_2;
    
    endmodule
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90

    运行仿真测试

    这里仿真只需要给一个时钟源即可,编写仿真代码实现100MHz的时钟。运行仿真将相关信号添加到波形窗口中,观察信号。这里的sum为做完FFT处理后,实现功率谱逻辑的信号。将波形转换成模拟形式后可看出波形和matlab的代码仿真类似,然后确定下横坐标是否为21和144,即对应信号频率是否为1MHz和7MHz。

    仿真波形

    从下图可看出,从FFT处理输出的第一个信号到输出第一个峰值花费了420ns,FFT的配置频率和工作频率是50MHz,也就是周期就是20ns,恰好对应了第21个点,和仿真结果一致。

    波形分析

    第二个峰值距离FFT输出第一个数据的时间花费了2880ns,换算下来也就是144个时钟周期,和仿真结果一致。

    波形分析

  • 相关阅读:
    Vercel 如何使用 Amazon EventBridge 调度器在2个月内发布 Cron 作业
    vue——前端发展、vue介绍、mvvm模式、组件化开发、单页面开发、模板插值语法、文本指令、事件指令、属性指令
    2023最新SSM计算机毕业设计选题大全(附源码+LW)之java高校教室管理系统9y8cv
    【JVM】垃圾收集算法
    经典垃圾回收器
    广西联合开展小额贷款公司联合检查,时间为9月11日-10月20日
    Java超全能笔记爆火,分布式/开源框架/微服务/性能调优全有,拿走不谢哦!
    深入浅出PyTorch函数torch.rand与torch.randn
    前端开发必备文档
    < Python全景系列-4 > 史上最全文件类型读写库大盘点!什么?还包括音频、视频?
  • 原文地址:https://blog.csdn.net/weixin_41445387/article/details/128078149