本文是iOS 使用AUGraph录音同时播放(并转码成MP3)中关于使用Lame将PCM转码成MP3的详细说明。看看时间戳真是触目惊心,时隔一年我才来填坑,惭愧忏愧。
有录音需求的朋友请先阅读上半部分,如果只需要转码MP3,看本文就够了。
下载DEMO
DEMO做了两件事情:
- 一边录音一边转码成MP3
- 将Wav文件转码成MP3文件
区别在于前者直接将内存中的数据转为Mp3,后者要先把文件读进内存再转码。
编译Lame库
1、下载Lame源码:lame.sourceforge.net
2、下载编译脚本:lame-ios-build
最近19大,Lame官网我都上不去了,嫌麻烦的可以直接到我的Github上去下载编译好的Lame库,两个文件分别是lame.h
和libmp3lame.a
,拖进项目即可食用。
准备
转码文件的话要先搞清楚PCM源的几个参数:
- 采样率
- 单声道/双声道
- 每个采样点的位数
我DEMO中的测试音频信息如下,采样率44.1kHz,双声道(Stereo),16bit
开始使用
代码节选自LameConver.m
lame_t lame; //1.声明一个全局变量
@implementation LameConver
/**
wav文件转mp3文件
@param wavPath wav文件路径(输入)
@param mp3Path mp3文件路径(输出)
*/
- (void)converWav:(NSString *)wavPath toMp3:(NSString *)mp3Path successBlock:(successBlock)block{
@try {
FILE *fwav = fopen([wavPath cStringUsingEncoding:NSASCIIStringEncoding], "rb");
fseek(fwav, 1024*4, SEEK_CUR); //跳过源文件的信息头,不然在开头会有爆破音
FILE *fmp3 = fopen([mp3Path cStringUsingEncoding:NSASCIIStringEncoding], "wb");
lame = lame_init(); //初始化
lame_set_in_samplerate(lame, 44100.0); //设置wav的采样率
lame_set_num_channels(lame, 2); //声道,不设置默认为双声道
lame_init_params(lame);
const int PCM_SIZE = 640 * 2; //双声道*2 单声道640即可
const int MP3_SIZE = 8800; //计算公式pcm_size * 1.25 + 7200
short int pcm_buffer[PCM_SIZE];
unsigned char mp3_buffer[MP3_SIZE];
int read, write;
do {
//将文件读进内存
read = fread(pcm_buffer, sizeof(short int), PCM_SIZE, fwav);
if (read == 0) {
//当read为0,说明pcm文件已经全部读取完毕,调用lame_encode_flush即可。
write = lame_encode_flush(lame, mp3_buffer, MP3_SIZE);
} else { //当read不为0,调用lame_encode_buffer_xxx进行转码
//双声道千万要使用lame_encode_buffer_interleaved这个函数
//32位、单声道需要调用其他函数,具体看代码后面的说明
write = lame_encode_buffer_interleaved(lame, pcm_buffer, read/2, mp3_buffer, MP3_SIZE);
}
//保存mp3文件
fwrite(mp3_buffer, write, 1, fmp3);
} while (read != 0);
//记得各种关闭
lame_close(lame);
fclose(fmp3);
fclose(fwav);
} @catch (NSException *exception) {
NSLog(@"catch exception");
} @finally {
block(); //成功转码后调用
}
}
- (void)
整个过程分为三步:
- 声明Lame全局变量
- 初始化Lame并设置各种转码参数
- 开始转码
第2步只设置了采样率和声道,实际上还有很多参数可以设置:
-
lame_set_quality(lame_global_flags *, int);
设置压缩品质,quality=0..9. 0=best (very slow). 9=worst. 品质越好转码速度越慢 -
lame_set_out_samplerate(lame_global_flags *, int);
设置输出MP3的采样率 -
lame_set_VBR(lame_global_flags *, vbr_mode);
设置VBR类型 - ......
lame.h
头文件中可以看到很多可设置参数,我没用到所以没有仔细看。有兴趣的可以去瞧瞧,注释也很全。
第3步中函数的调用,搞清楚输入源的声道和每个采样点的位数,调用对应的函数:
-
lame_encode_buffer
单声道,16位 -
lame_encode_buffer_interleaved
双声道,16位 -
lame_encode_buffer_float
单声道,32位
Lame就是这么方便简单,到这里就结束啦。如果本文对你有帮助,请Star,非常感谢!
fopen
补充一个fopen
的知识点
头文件:#include<stdio.h>
定义函数:FILE * fopen(const char * path,const char * mode);
函数参数说明:
path
:字符串包含欲打开的文件路径及文件名。
mode
:字符串则代表着流形态,取值如下:
-
r
打开只读文件,该文件必须存在。 -
r+
打开可读写的文件,该文件必须存在。 -
w
打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。 -
w+
打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。 -
a
以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。 -
a+
以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。
上述的形态字符串都可以再加一个b
字符,如rb
、w+b
或ab+
等组合,加入b
字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。
返回值:
文件顺利打开后,指向该流的文件指针就会被返回,如果文件打开失败则返回NULL。
参考
stackoverflow
文件操作函数fread,fwrite,fseek,fopen,fclose解析
关于我
我是可乐,在职iOS开发,业余时间独立开发App,现有上架作品:Mini记账
vx公z号:沙拉可乐, 分享独立开发的干货和背后的故事