Project Icon

amodem

音频调制解调库实现无网络数据传输

amodem是一个Python实现的音频调制解调库,可通过声卡实现计算机间的数据传输。它支持多种调制方式和采样率,使用OFDM技术,最高可达80kbps的传输速率。该项目适用于空中隔离或有线连接的场景,为无网络环境下的数据交换提供了解决方案。

音频调制解调器通信库

.. image:: https://img.shields.io/pypi/pyversions/amodem.svg :target: https://pypi.python.org/pypi/amodem/ :alt: Python 版本 .. image:: https://img.shields.io/pypi/l/amodem.svg :target: https://pypi.python.org/pypi/amodem/ :alt: 许可证 .. image:: https://img.shields.io/pypi/v/amodem.svg :target: https://pypi.python.org/pypi/amodem/ :alt: 包版本 .. image:: https://img.shields.io/pypi/status/amodem.svg :target: https://pypi.python.org/pypi/amodem/ :alt: 开发状态

描述

该程序可以使用简单的耳机在两台计算机之间传输文件,实现真正的空中隔离通信(通过扬声器和麦克风),或使用音频线缆(以获得更高的传输速度)。

发送方将输入数据调制成音频信号,然后通过声卡播放。

接收方录制音频,并将其解调回原始数据。

该过程需要一个手动校准步骤:发送方必须为其声卡找到最佳输出音量,该音量不会使接收麦克风饱和,并为解调提供足够好的信噪比。

HackerNews 讨论:https://news.ycombinator.com/item?id=17333257

技术细节

该调制解调器使用 OFDM 通过音频线缆进行通信,具有以下参数:

  • 采样率:8/16/32 kHz
  • 波特率:1 kHz
  • 符号调制:BPSK、4-PSK、16-QAM、64-QAM、256-QAM
  • 载波:2-11 kHz(最多十个载波)

这样,调制解调器可以达到 80kbps 比特率 = 10 kB/s(在最佳信噪比条件下)。

每个 250 字节的数据帧使用简单的 CRC-32 校验和来验证数据完整性。

安装

确保已安装所有必需的软件包(在 Debian 上):

$ sudo apt-get install python-numpy python-pip portaudio19-dev git

从 PyPI 获取最新发布版本:

$ pip install --user amodem

或者,尝试从 GitHub 获取最新(不稳定)开发版本:

$ git clone https://github.com/romanz/amodem.git
$ cd amodem
$ pip install --user -e .

对于图形和可视化(可选),安装 matplotlib Python 包。

验证安装,运行:

$ export BITRATE=48  # 显式选择高调制解调器比特率(假设良好的信噪比)。
$ amodem -h
usage: amodem [-h] {send,recv} ...

音频 OFDM 调制解调器:48.0 kb/s(64-QAM x 8 载波)Fs=32.0 kHz

位置参数:
  {send,recv}
    send         将二进制数据调制为音频信号。
    recv         将音频信号解调为二进制数据。

可选参数:
  -h, --help     显示此帮助消息并退出

在 Windows 上,您可以从 MinGW <https://packages.msys2.org/base/mingw-w64-portaudio>_ 下载 portaudio 库。 然后,您应该使用以下命令行标志指定 DLL:

-l AUDIO_LIBRARY, --audio-library AUDIO_LIBRARY
                    PortAudio 共享库的文件名。

校准

在发送方和接收方之间连接音频线缆,并运行以下脚本:

在发送方:

~/sender $ export BITRATE=48  # 显式选择高调制解调器比特率(假设良好的信噪比)。
~/sender $ amodem send --calibrate

在接收方:

~/receiver $ export BITRATE=48  # 显式选择高调制解调器比特率(假设良好的信噪比)。
~/receiver $ amodem recv --calibrate

如果未设置 BITRATE,调制解调器将使用 1 kbps 设置(单频率 BPSK 调制)。

调整发送方计算机的输出音量,直到所有频率都能良好接收:

3000 Hz: 良好信号 4000 Hz: 良好信号 5000 Hz: 良好信号 6000 Hz: 良好信号 7000 Hz: 良好信号 8000 Hz: 良好信号 9000 Hz: 良好信号 10000 Hz: 良好信号

如果信号"太弱",请提高发送方的输出音量。

如果信号"太强",请降低发送方的输出音量。

如果信号"太嘈杂",可能是噪声水平太高或模拟信号失真。 请在校准会话期间运行以下命令, 并将生成的 audio.raw 文件发送给我进行调试:

~/receiver $ arecord --format=S16_LE --channels=1 --rate=32000 audio.raw

您可以查看 校准过程的截屏 <https://asciinema.org/a/25065?autoplay=1>_。

使用方法

准备发送方(生成要发送的随机二进制数据文件):

~/sender $ dd if=/dev/urandom of=data.tx bs=60KB count=1 status=none
~/sender $ sha256sum data.tx
008df57d4f3ed6e7a25d25afd57d04fc73140e8df604685bd34fcab58f5ddc01  data.tx

启动接收方(将等待发送方开始):

~/receiver $ amodem recv -vv -o data.rx

启动发送方(将调制数据并开始传输):

~/sender $ amodem send -vv -i data.tx

发送方应输出类似的日志:

2015-02-06 18:12:46,222 DEBUG      音频 OFDM 调制解调器:48.0 kb/s(64-QAM x 8 载波)Fs=32.0 kHz
2015-02-06 18:12:46,222 INFO       已加载 PortAudio V19-devel(构建于 2014 年 2 月 25 日 21:09:53)
2015-02-06 18:12:48,297 INFO       发送 2.150 秒的训练音频
2015-02-06 18:12:48,297 INFO       开始调制
2015-02-06 18:12:49,303 DEBUG      已发送      6.000 kB
2015-02-06 18:12:50,296 DEBUG      已发送     12.000 kB
2015-02-06 18:12:51,312 DEBUG      已发送     18.000 kB
2015-02-06 18:12:52,290 DEBUG      已发送     24.000 kB
2015-02-06 18:12:53,299 DEBUG      已发送     30.000 kB
2015-02-06 18:12:54,299 DEBUG      已发送     36.000 kB
2015-02-06 18:12:55,306 DEBUG      已发送     42.000 kB
2015-02-06 18:12:56,296 DEBUG      已发送     48.000 kB
2015-02-06 18:12:57,311 DEBUG      已发送     54.000 kB
2015-02-06 18:12:58,293 DEBUG      已发送     60.000 kB
2015-02-06 18:12:58,514 INFO       已发送 60.000 kB @ 10.201 秒
2015-02-06 18:12:59,506 DEBUG      正在关闭输入和输出

接收方应输出类似的日志: 2015-02-06 18:12:44,848 调试 音频 OFDM 调制解调器: 48.0 kb/s (64-QAM x 8 载波) Fs=32.0 kHz 2015-02-06 18:12:44,849 信息 PortAudio V19-devel (构建于 2014年2月25日 21:09:53) 已加载 2015-02-06 18:12:44,929 调试 异步读取线程已启动 2015-02-06 18:12:44,930 调试 跳过 0.100 秒 2015-02-06 18:12:45,141 信息 等待载波音: 3.0 kHz 2015-02-06 18:12:47,846 信息 载波在 ~2265.0 ms @ 3.0 kHz 处检测到 2015-02-06 18:12:47,846 调试 已缓冲 1000 ms 的音频 2015-02-06 18:12:48,025 调试 载波从 2264.000 ms 开始 2015-02-06 18:12:48,029 调试 载波符号振幅: 0.573 2015-02-06 18:12:48,030 调试 载波当前相位: 0.061 2015-02-06 18:12:48,030 调试 频率误差: -0.009 ppm 2015-02-06 18:12:48,030 调试 频率校正: 0.009 ppm 2015-02-06 18:12:48,030 调试 增益校正: 1.746 2015-02-06 18:12:48,198 调试 前缀正确 2015-02-06 18:12:48,866 调试 3.0 kHz: 信噪比 = 34.82 dB 2015-02-06 18:12:48,866 调试 4.0 kHz: 信噪比 = 36.39 dB 2015-02-06 18:12:48,867 调试 5.0 kHz: 信噪比 = 37.88 dB 2015-02-06 18:12:48,867 调试 6.0 kHz: 信噪比 = 38.58 dB 2015-02-06 18:12:48,867 调试 7.0 kHz: 信噪比 = 38.86 dB 2015-02-06 18:12:48,867 调试 8.0 kHz: 信噪比 = 38.63 dB 2015-02-06 18:12:48,867 调试 9.0 kHz: 信噪比 = 38.07 dB 2015-02-06 18:12:48,868 调试 10.0 kHz: 信噪比 = 37.22 dB 2015-02-06 18:12:48,869 信息 开始解调 2015-02-06 18:12:49,689 调试 已获得 6.000 kB, 信噪比: 41.19 dB, 漂移: -0.01 ppm 2015-02-06 18:12:50,659 调试 已获得 12.000 kB, 信噪比: 41.05 dB, 漂移: -0.00 ppm 2015-02-06 18:12:51,639 调试 已获得 18.000 kB, 信噪比: 40.96 dB, 漂移: -0.00 ppm 2015-02-06 18:12:52,610 调试 已获得 24.000 kB, 信噪比: 41.47 dB, 漂移: -0.01 ppm 2015-02-06 18:12:53,610 调试 已获得 30.000 kB, 信噪比: 41.06 dB, 漂移: -0.00 ppm 2015-02-06 18:12:54,589 调试 已获得 36.000 kB, 信噪比: 41.37 dB, 漂移: -0.00 ppm 2015-02-06 18:12:55,679 调试 已获得 42.000 kB, 信噪比: 41.13 dB, 漂移: -0.00 ppm 2015-02-06 18:12:56,650 调试 已获得 48.000 kB, 信噪比: 41.31 dB, 漂移: -0.00 ppm 2015-02-06 18:12:57,631 调试 已获得 54.000 kB, 信噪比: 41.23 dB, 漂移: +0.00 ppm 2015-02-06 18:12:58,605 调试 已获得 60.000 kB, 信噪比: 41.31 dB, 漂移: +0.00 ppm 2015-02-06 18:12:58,857 调试 检测到 EOF 帧 2015-02-06 18:12:58,857 调试 已解调 61.205 kB @ 9.988 秒 (97.9% 实时) 2015-02-06 18:12:58,858 信息 接收到 60.000 kB @ 9.988 秒 = 6.007 kB/s 2015-02-06 18:12:58,876 调试 正在关闭输入和输出 2015-02-06 18:12:58,951 调试 异步读取线程已停止 (读取了 896000 字节)

接收器完成后,验证接收文件的哈希值:

~/receiver $ sha256sum data.rx 008df57d4f3ed6e7a25d25afd57d04fc73140e8df604685bd34fcab58f5ddc01 data.rx

你可以在这里观看数据传输过程的屏幕录像。

I/O 重定向

音频可以写入/读取中间 PCM 文件(而不是扬声器/麦克风),使用以下命令:

$ echo 123 | amodem send -o /tmp/file.pcm
发送 0.800 秒的训练音频
开始调制
已发送 0.004 kB @ 0.113 秒

$ amodem recv -i /tmp/file.pcm
等待载波音: 2.0 kHz
载波在 ~150.0 ms @ 2.0 kHz 处检测到
载波相干性: 100.000%
载波符号振幅: 1.000
频率误差: 0.000 ppm
开始解调
123
接收到 0.004 kB @ 0.011 秒 = 0.376 kB/s

可视化

确保已安装 "matplotlib" 包,并在接收端运行:

~/receiver $ amodem recv --plot -o data.rx
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号