几个星期前我已经下载了Privoxy,为了好玩,我很想知道它的简单版本是如何完成的.
我知道我需要配置浏览器(客户端)以向代理发送请求.代理将请求发送到Web(假设它是一个http代理).代理将收到答案......但代理如何将请求发送回浏览器(客户端)?
我在网上搜索了C#和http代理,但是没有找到让我理解它在幕后正确工作的东西.(我相信我不想要反向代理,但我不确定).
你们有没有一些解释或一些信息让我继续这个小项目?
这就是我的理解(见下图).
步骤1我将所有请求的客户端(浏览器)配置为在Proxy侦听的端口发送到127.0.0.1.这样,请求将不会直接发送到Internet,而是由代理处理.
步骤2代理查看新连接,读取HTTP标头并查看必须执行的请求.他执行请求.
步骤3代理从请求中接收答案.现在他必须从网上发送答案给客户但是怎么样???
Mentalis代理:我发现这个项目是一个代理(但我想要的更多).我可能会查看来源,但我真的想要一些基本的东西来理解更多的概念.
ASP代理:我也许可以在这里获得一些信息.
请求反射器:这是一个简单的例子.
这是一个带有简单Http代理的Git Hub存储库.
我不会使用HttpListener或类似的东西,这样你就会遇到很多问题.
最重要的是,支持将是一个巨大的痛苦:
代理保持活力
SSL将无法正常工作(以正确的方式,您将获得弹出窗口)
.NET库严格遵循RFC,导致某些请求失败(即使IE,FF和世界上任何其他浏览器都能正常工作.)
你需要做的是:
侦听TCP端口
解析浏览器请求
提取主机以TCP级别连接到该主机
除非您想要添加自定义标题等,否则来回转发所有内容.
我在.NET中编写了2个不同的HTTP代理,它们有不同的要求,我可以告诉你,这是最好的方法.
Mentalis这样做,但他们的代码是"委托意大利面条",比GoTo更差:)
您可以使用HttpListener
类构建一个用于侦听传入请求,并使用HttpWebRequest
类来中继请求.
我最近使用TcpListener和TcpClient在c#.net中编写了一个轻量级代理.
https://github.com/titanium007/Titanium-Web-Proxy
它以正确的方式支持安全HTTP,客户端机器需要信任代理使用的根证书.还支持WebSockets中继.除流水线外,支持HTTP 1.1的所有功能.大多数现代浏览器都不使用流水线技术.还支持Windows身份验证(普通,摘要).
您可以通过引用项目来连接应用程序,然后查看和修改所有流量.(要求和回应).
就性能而言,我已经在我的机器上进行了测试,并且没有任何明显的延迟.
代理可以按以下方式工作.
Step1,配置客户端使用proxyHost:proxyPort.
Proxy是一个正在侦听proxyHost:proxyPort的TCP服务器.浏览器打开与Proxy的连接并发送Http请求.代理解析此请求并尝试检测"主机"标头.此标头将告知Proxy在何处打开连接.
步骤2:代理打开与"主机"标头中指定的地址的连接.然后它将HTTP请求发送到该远程服务器.阅读回复.
步骤3:从远程HTTP服务器读取响应后,Proxy通过先前打开的TCP连接与浏览器发送响应.
示意图它将如下所示:
Browser Proxy HTTP server Open TCP connection Send HTTP request -----------> Read HTTP header detect Host header Send request to HTTP -----------> Server <----------- Read response and send <----------- it back to the browser Render content
如果您只是想拦截流量,可以使用fiddler核心来创建代理......
http://fiddler.wikidot.com/fiddlercore
首先使用UI运行fiddler以查看它的功能,它是一个允许您调试http/https流量的代理.它是用c#编写的,并且有一个可以构建到自己的应用程序中的核心.
请记住,FiddlerCore不适用于商业应用程序.
OWIN和WebAPI让事情变得非常简单.在我搜索C#代理服务器时,我也发现了这篇文章http://blog.kloud.com.au/2013/11/24/do-it-yourself-web-api-proxy/.这将是我正在走的路.
如果你使用HTTPListener同意邪恶,你会有很多问题,你必须解析请求,并将参与标题和...
使用tcp listener来监听浏览器请求
仅解析请求的第一行并获取要连接的主机域和端口
在浏览器请求的第一行上将确切的原始请求发送到找到的主机
从目标站点接收数据(我在本节中有问题)
将从主机收到的确切数据发送到浏览器
你看到你甚至不需要知道浏览器请求中的内容并解析它,只从第一行得到目标站点地址第一行通常喜欢这个GET http://google.com HTTP1.1或CONNECT facebook.com: 443(这是针对ssl请求)