K230播放音频总是有杂音

直接使用代码示例里的play_audio是没问题的

现在想达到一个效果,就是识别到人体之后就播放一个音频,因此把play_audio和person_detection做了一个拼接

但是每次识别之后播放音频的时候都有有杂音和声音卡顿,有大佬遇到过这个问题吗?