<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Also, I think that counting users by IP is still a fine way to do it (absent the privacy issue that PCSA tries to address). I was just stating that my understanding based on talking to the Tor Metrics people is that the plan is to handle the privacy issue by moving to per-connection country statistics instead of by implementing PCSA.<div class=""><br class=""></div><div class="">I would also wonder how the privacy of PCSA actually compares to the privacy of per-country (noisy) counting, especially if the local statistics could be locally stored in a differentially-private way (again, this requires an accuracy analysis). As Tschorsch and Scheuermann note [0], the FM sketch used by PCSA  can indicate the presence of an individual user (Sec. 4). Thus they propose to add noise by independently flipping some of the PCSA bits (Sec. 5). This seems quite similar to the differentially-private technique of adding noise to a counter. It is not clear to me that it is better to suffer the inaccuracy of the PCSA sketching plus that of the added noise when one could simply rely on adding differentially-private noise, especially when the latter provides a precise notion of privacy where the former does not.</div><div class=""><div class=""><br class=""></div><div class="">Best,</div><div class="">Aaron</div><div class=""><br class=""></div><div class="">[0] Florian Tschorsch and Björn Scheuermann, "An algorithm for privacy-preserving distributed user statistics”, Computer Networks 57 (2013).</div><div class=""><div class=""><br class=""><div><blockquote type="cite" class=""><div class="">On Apr 2, 2017, at 9:07 AM, Aaron Johnson <<a href="mailto:aaron.m.johnson@nrl.navy.mil" class="">aaron.m.johnson@nrl.navy.mil</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta http-equiv="Content-Type" content="text/html charset=utf-8" class=""><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Sorry, I should have been more clear there. Tor Metrics estimates the total number of users by counting the number of directory downloads and dividing by an estimated expected number of directory downloads per user per day (10, I believe). This statistic is in the graph under the “Relay Users” tab on <<a href="https://metrics.torproject.org/userstats-relay-country.html" class="">https://metrics.torproject.org/userstats-relay-country.html</a>>.<div class=""><br class=""></div><div class="">Best,</div><div class="">Aaron</div><div class=""><br class=""><div class=""><blockquote type="cite" class=""><div class="">On Apr 2, 2017, at 8:51 AM, Veer Kalantri <<a href="mailto:mads.531998@gmail.com" class="">mads.531998@gmail.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class="">about which stats are you talking Aaron?<div class=""><br class=""></div></div><div class="gmail_extra"><br class=""><div class="gmail_quote">On Sun, Apr 2, 2017 at 5:45 PM, Aaron Johnson <span dir="ltr" class=""><<a href="mailto:aaron.m.johnson@nrl.navy.mil" target="_blank" class="">aaron.m.johnson@nrl.navy.mil</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">> These statistics not just tell about the user's country but also keep a<br class="">
> track of unique IP addresses connecting from each country. This is<br class="">
> needed so as to present more realistic stats. If we increment counter on<br class="">
> any IP address instead of unique IP address then the statistics would<br class="">
> also reflect  user(s) connecting again and again. If we don't count<br class="">
> Unique IPs, we would have stats about per country usage rather than per<br class="">
> country users. We could do much better and implement a way(as described<br class="">
> by the OP of thread) that counts unique IPs at the same time preserves<br class="">
> privacy.<br class="">
<br class="">
It is true that this would count connections rather than unique IPs. However, Tor already infers the number of users by counting directory downloads and then adjusting that number based on  how many each user is expected to make. In addition, each user doesn’t necessarily correspond to a different IP because of NAT, and so counting connections may actually be more accurate.<br class="">
<br class="">
Best,<br class="">
Aaron<br class="">
______________________________<wbr class="">_________________<br class="">
tor-dev mailing list<br class="">
<a href="mailto:tor-dev@lists.torproject.org" class="">tor-dev@lists.torproject.org</a><br class="">
<a href="https://lists.torproject.org/cgi-bin/mailman/listinfo/tor-dev" rel="noreferrer" target="_blank" class="">https://lists.torproject.org/<wbr class="">cgi-bin/mailman/listinfo/tor-<wbr class="">dev</a><br class="">
</blockquote></div><br class=""></div>
_______________________________________________<br class="">tor-dev mailing list<br class=""><a href="mailto:tor-dev@lists.torproject.org" class="">tor-dev@lists.torproject.org</a><br class=""><a href="https://lists.torproject.org/cgi-bin/mailman/listinfo/tor-dev" class="">https://lists.torproject.org/cgi-bin/mailman/listinfo/tor-dev</a><br class=""></div></blockquote></div><br class=""></div></div></div></blockquote></div><br class=""></div></div></div></body></html>