On Monday, March 18, 2013, Moritz Bartl  wrote:<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 18.03.2013 12:05, Zack Weinberg wrote:<br>
>  * TCP port<br>
>  * "Public suffix" + 1 domain component of destination<br>
>    (<a href="http://example.com" target="_blank">example.com</a>, <a href="http://example.co.uk" target="_blank">example.co.uk</a>)<br>
<br>
I am not sure I like this. Maybe we might want to limit it to popular<br>
destinations -- drop sites that only get few hits? And rougher access<br>
numbers (50 hits, 100, etc)?<br>
</blockquote><div><br></div><div>The "differential privacy" sanitization algorithm discussed in the next section is in fact a more systematic and theoretically grounded way of doing just this. Sites that are rarely visited will have their true visit rate overwhelmed by the added noise, which can either add to or subtract from the number.  Sites that are frequently visited will simply have their true visit count rendered uncertain.</div>
<div><br></div><div>I shall<span></span> look into the possibility of adding completely fake visits to the statistics as well.</div>