tracker是指运行于服务器上的一个程序,这个程序能够追踪到底有多少人同时在下载同一个文件。
系统简介
BT中的Tracker
客户端连上tracker服务器,就会获得一个下载人员的名单,根据这个,BT会自动连上别人的机器进行下载。它是提供
bt的服务器。把文件用bt发布出来的人需要知道该使用哪个服务器来
为要发布的文件提供tracker。由于不指定服务器,
BitTorrent采用
BT文件来确定下载源。
tracker服务器是
BT下载中必须的角色。一个BTclient在下载开始以及下载进行的过程中,要不停的与tracker服务器进行通信,以报告自己的信息,并获取其它下载client的信息。这种通信是通过
HTTP协议进行的,又被称为tracker HTTP协议,它的过程是这样的:
client向tracker发一个
HTTP的GET请求,并把它自己的信息放在GET的参数中;这个请求的大致意思是:我是xxx(一个唯一的id),我想下载yyy文件,我的ip是aaa,我用的端口是bbb。。。
tracker对所有
下载者的信息进行维护,当它收到一个请求后,首先把对方的
信息记录下来(如果已经记录在案,那么就检查是否需要更新),然后将一部分(并非全部,根据设置的参数已经下载者的请求)参与下载同一个文件(一个tracker服务器可能同时维护多个文件的下载)的下载者的信息返回给对方。
Client在收到tracker的响应后,就能获取其它下载者的信息,那么它就可以根据这些信息,与其它下载者建立连接,从它们那里下载文件片断。
tracker服务器架设
BitTorrent Tracker是一个高性能增强型
BitTorrent服务器。BitTorrent Tracker同时支持HTTP和
UDP的Tracker协议,采用
高性能服务器技术, 支持
多端口同时监听,
数据更新插件。BitTorrent Tracker通过了8万个文件和80万个在线用户的高强度测试。用户可根据需要自行改写数据库通信插件, 打造属于自己的服务器, 配合
服务器端脚本可实现一个功能完备的BT服务器。
一点渣图解翻译勿喷
BitTorrent Tracker 的特点:
C++编写,采用高性能网络通信技术, 高效稳定。
配置简单容易。
支持HTTP和
UDP两种连接模式, 与
BitTorrent客户端完美配合。
用浏览器进行远程状态监视。
支持自定义的数据库插件, 并提供一个SDK开发示例。
BitTorrent Tracker 更新日志:
[CORE] 修正了不能在Windows2000操作系统下运行的错误
[CORE] 修正了长时间运行Session Table数过高的问题
[CORE] 使用新的
多线程内核,提高了数据处理能力
[GUI]
运行时每隔半小时在exe目录里的TrackerLaunchLog.
txt文件中记录程序
运行状态[GUI] 配置对话框增强数据库认证功能,分为数据库中存在记录和数据库中通过验证两个级别
[CORE] db_fetch() 函数参数改进,可指定数据库认证级别
[CORE] 改进了程序异常退出时的错误检测机制,
错误报告可以捕获更多类型的程序
运行时错误[PLUGIN] db_fetch2() 函数参数改进,可从数据库同时查询新增及删除的记录
[PLUGIN] db_mysql 插件实现了 db_fetch() 和 db_fetch2() 函数的示例代码
[PLUGIN] db_mssql 插件实现了 db_fetch2() 函数的示例代码
[GUI] 添加了更多的数据库选项
[GUI] 发生错误时显示更详细的提示信息
[CORE] 增加了连接请求验证模式,只处理数据库中存在的任务
[CORE] 修正了长时间运行引起的高
CPU负载的问题
[CORE] 修正了错误报告中
dmp文件不能被打包的问题
[CORE] 修正了一些可能导致运行时错误的问题
[PLUGIN] 增加了两个数据读取函数
在“
BT协议规范”中已经给出,这里不再重复。下面我们
具体分析 tracker服务器的实现细节。
从哪里开始?
要建立一个 tracker服务器,只要运行 程序就行了,它最少需要一个参数,就是 –dfile,这个参数指定了保存下载信息的文件。Bttrack.p 调用 中的 track()函数。因此,我们跟踪到 track.p 中去看track() 函数。
Track.p:track()
这个函数首先对
命令行的参数进行检查;然后将这些参数保存到 config 字典中。在BT中所有的工具程序,都有类似的处理方式。
接下来的代码:
r = RawServer(Event(), config['timeout_check_interval'], config['socket_timeout'])
t = Tracker(config, r)
r.bind(config['port'], config['bind'], True)
r.listen_forever(HTTPHandler(t.get, config['min_time_between_log_flushes']))
t.save_dfile()
首先是创建一个 RawServer 对象,这是一个服务器对象,它将实现一个
网络服务器的一些细节封装起来。不仅tracker服务器用到了 RawServer,我们以后还可以看到,由于每个 client端也需要给其它 client 提供下载服务,因此也同时是一个服务器,client的实现中,也用到了RawServer,这样,RawServer的代码得到了重用。关于 RawServer的详细实现,在后面的小节中进行分析。
接着是创建一个 Tracker对象。
然后让RawServer绑定在指定的端口上(通过命令行传递进来)。
最后,调用 RawServer::listen_forever() 函数,使得服务器
投入运行。
最后,在服务器因某些原因结束运行以后,调用 Tracker::save_dfile() 保存下载信息。这样,一旦服务器再次投入运行,可以恢复当前的状态。
系统相关
BT源码的分布
把BT的源码展开之后,可以看到有一些python程序,还有一些说明文件等等,此外还有一个
BitTorrent目录。这些 python程序,实际是一些小工具,比如制作 metafile的、运行tracker服务器的、运行BT client端的 btdownloadheadless 等等。而这些程序中,用到的一些 python 类的实现,都放在
子目录 BitTorrent 下面。我们的分析工作,通常是从工具程序入手,而随着分析的展开,则重点是看 BitTorrenet子目录下的代码。
在谈到如何开发可维护的代码的一篇文章中,其中提到的一条就是开发一些小工具以简化工作,我想BT的这种源码结构,也正是作者思想的一种体现吧。
python的应用
python和我们以前接触的 c/c++ 不一样的第一个地方就是它的函数在定义的时候,不用指定参数类型。既然这样,那么,在调用函数的时候,你可以传递任意类型的参数进来。例如这样的函数:
def foo(arg):
print type(arg)
你可以这样来调用:
a = 100
b = “hello world”
foo(a)
foo(b)
输出结果是:
这是因为,第一次调用 foo()的时候,传递的是一个整数类型,而第二次调用的时候,传递的是一个
字符串类型。
这种参数具有动态类型的特性,是
c/c++等传统的语言是所不具备的。这也是 python 被称为
动态语言的一个原因吧。C++的高级特性模板,虽然也使得参数类型可以动态化,但使用起来,远没有python这么简单方便。
许多新游戏不惜大量硬盘空间使用Wave或
APE等
音乐格式,但在以前由于
存储空间很小,游戏的音乐大多是都是模块音乐。(一些对容量有苛刻要求的游戏仍然使用这类格式)
除了在游戏中,。