<div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="Ih2E3d"><br>
&gt; Scanning methodology:<br>
&gt;<br>
&gt; The first scans to be implemented are HTTP, HTML, Javascript, and<br>
&gt; SSL scans.<br>
&gt;<br>
&gt; The HTTP scan scrapes Google for common filetype urls such as exe, msi,<br>
&gt; doc, dmg, etc. It then fetches these urls through Non-Tor and Tor, and<br>
&gt; compares the SHA1 hases of the resulting content.<br>
</div> &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;^^hashes<br>
<div class="Ih2E3d">&gt; The SSL scan downloads certificates for all IPs a domain will locally<br>
&gt; resolve to and compares these certificates to those seen over Tor. The<br>
&gt; scanner notes if a domain had rotated certificates locally in the<br>
&gt; results for each scan.<br>
&gt;<br>
&gt; The HTML scan checks HTML, Javascript, and plugin content for<br>
&gt; modifications. Because of the dynamic nature of most of the web, the<br>
&gt; scanner has a number of mechanisms built in to filter out false<br>
&gt; positives that are used when a change is noticed between Tor and<br>
&gt; Non-Tor.<br>
<br>
</div>As an eventual feature, for the above tests, it probably makes sense<br>
to be able to imitate a few different popular browsers as the scanner<br>
does its checks. &nbsp;If an adversary can recognize the scanner, it can<br>
MITM everything _but_ the scanner.<br></blockquote><div><br></div><div>You&#39;re right. &nbsp;It would be best to imitate different browsers.</div><div><br></div><div>I got one thing to add to this. &nbsp;Simply using a &quot;User-Agent:&quot; header isn&#39;t good enough. &nbsp;You will need to look at the order in which the headers are sent. &nbsp;As an example (which may or may not be accurate) FF may send &quot;User-Agent:&quot; before a &quot;Accept-Encoding:&quot; where IE may do the opposite. &nbsp;It would be feasible for an attacker to analyze the order of the HTTP headers to determine which browser is being used, or in this case, that a scanner is being used.<br>
</div><div><br></div><div>I looked at this some time back and was able to guess, very accurately at that, which browser was being used. &nbsp;Specifically, I was looking for FF agents pretending to be a different browser.</div>
<div><br></div><div>Just my $0.02...<br></div><div><br></div><div>- Kyle</div></div>