Python爬取FLASH播放器中的资料。
一、首先了解一下AMF协议:
AMF(Action Message Format)是Flash与服务端通信的一种常见的二进制编码模式,其传输效率高,可以在HTTP层面上传输。现在很多Flash WebGame都采用这样的消息格式。
AMF协议是基于Http协议的.
它的内容处理过程大致是这样:
1.从客户端获取Http请求(Request)流.
2.对流进行解串行化(Deserialize),得到服务器端程序能够识别的数据,并建立一个响应(Response)消息
3.Debug开始
4.对流进行各种处理(记录、许可、服务)得到返回值
5.对响应流进行串行化
6.发送Http响应给客户端
二、Python与amf进行互通需要用到PyAMF
1、下载pyamf
https://pypi.python.org/pypi/PyAMF
2、安装pyamf
下载完成之后解压出来,打开DOS命令进入pyamf目录,
执行下列命令,安装pyamf框架
python setup.py install --disable-ext
三、获取关键字节伪造访问
首先使用charles抓包工具,抓取AMF包,得到请求/应答的AMF数据,对AMF格式的请求和响应的数据进行分析。
解密的POST DATA如下图所示:
构建flex.messaging.messages.RemotingMessage信息
msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
clometOd=None,\
operation='playeSource',\
destination='metaDataService',\
timeTolive=0,\
timestamp=0
)
msg.body=['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint']='my-amf'
msg.headers['DSId']=str(uuid.uuid1()).upper()
......
得到的Response如下图:
四、具体实现代码如下:
import urllib2
import uuid
import pyamf
from pyamf import remoting
from pyamf.flex import messaging
# 构造flex.messaging.messages.RemotingMessage消息
msg= messaging.RemotiongMessage(messageId=str(uuid.uuid1()).upper(),\
clometOd=None,\
operation='playeSource',\
destination='metaDataService',\
timeTolive=0,\
timestamp=0
)
msg.body = ['xxx', 'aaaaa', 'ccccc','ddddd', '', 'eeeee', '']
msg.headers['DSEndpoint'] = 'my-amf'
msg.headers['DSId'] = str(uuid.uuid1()).upper()
# 按AMF协议编码
req = remoting.Request('null', body=(msg,))
env = remoting.Envelope(amfVersion=pyamf.AMF3)
env.bodies = [('/1',req)]
data = bytes(remoting.encode(env).read())
# 提交请求
url = 'http://xxxx.xx.xx/amf'
req = urllib2.Request(url,data,headers={'Content-Type':'application/x-amf'})
# 解析返回数据
oepner = urllib2.build_opener()
# 解码AMF协议返回的数据
resp = remoting.decode(opener.open(req).read())
print resp.bodies[0][1].body.body['xxxx']
......