[ad_1]

اورلاندو ، فلوریدا – ابتدا “سر و صدا” – اشتباهات کوچکی که اداره سرشماری ایالات متحده تصمیم گرفت در سرشماری سال 2020 برای محافظت از حریم خصوصی شرکت کنندگان مرتکب شود. این اداره اکنون “داده های مصنوعی” را بررسی می کند ، و اعداد گسترده ای را برای تحقیقات اقتصادی و جمعیتی دستکاری می کند تا هویت افرادی که اطلاعات را ارائه داده اند پنهان کند.

این اقدامات برخی محققان را بر آن داشته است تا با ترس از اینكه سازمان آماری می تواند برای حفظ حریم خصوصی خود حسادت خود را فدا كند ، مبارزه كنند.

آمارهای اداره سرشماری هفته گذشته در یک کنفرانس مجازی نشان داد که طی سه سال آینده آنها تلاش خواهند کرد تا روشی را برای ایجاد “داده های مصنوعی” برای پرونده ها در افراد و خانه هایی که قبلا از اطلاعات شخصی محروم شده اند ، ایجاد کنند ، معروف به آمریکایی جامعه ریز داده های مطالعه توسط محققان برای ایجاد جداول سفارشی متناسب با تحقیقات خود استفاده می شود.

آمارهای اداره سرشماری گفت که اقدامات محرمانه بیشتری لازم است زیرا نوآوری های فن آوری تهدید شناسایی افراد را از طریق پاسخ های محرمانه نظرسنجی افزایش می دهد. در حال حاضر ، قدرت محاسبات به قدری زیاد است که می تواند مجموعه داده های شخص ثالث را که اطلاعات شخصی شرکت های رتبه بندی اعتباری و شبکه های اجتماعی ، سوابق خرید ، الگوهای رأی گیری و اسناد عمومی را در کنار هم ترکیب می کند ، به راحتی خرد کند.

“این یک عمل متعادل کننده است. قانون ما را ملزم به انجام کارهای رقابتی می کند. ما باید آماری درباره ملت منتشر کنیم تا به مردم اجازه تصمیم گیری مفید را بدهیم. اما ما همچنین باید از حریم خصوصی پاسخگویان خود محافظت کنیم. “” رولاندو رودریگز ، آماری در دفتر سرشماری گفت.

با این حال ، منتقدان می گویند این پیشنهاد ، همراه با تلاش مستمر برای افزودن نادرستی های جزئی به داده های سرشماری سال 2020 برای محافظت از محرمانه بودن شرکت کنندگان ، اعتبار دفتر سرشماری را به عنوان ارائه دهنده داده های دقیق در مورد جمعیت ایالات متحده تضعیف می کند.

استفان راگلز ، جمعیت شناس دانشگاه مینه سوتا با تأكید اظهار داشت كه داده های مصنوعی “برای تحقیق مناسب نخواهد بود”.

راگلز گفت: “دفتر سرشماری تهدیدهای محرمانه ای را تخریب می كند تا دسترسی عمومی به داده ها را به شدت كاهش دهد.” “من فکر نمی کنم که ادامه یابد زیرا جامعه برای عملکرد به اطلاعات نیاز دارد.”

میکرو داده هر ساله از یک نظرسنجی در جامعه ایالات متحده بر روی نمونه ای از 3/5 میلیون خانوار جمع آوری می شود که به جمعیت های مختلف ، از سرتاسر کشور تا محلات برون یابی می شود. این دامنه وسیعی از تخمین ها از ترکیب جمعیتی و ویژگی های مسکن در کشور را فراهم می کند. راگلز گفت ، از میکرو داده سالانه در حدود 12000 مقاله علمی استفاده می شود.

داده های مصنوعی با استفاده از متغیرها در داده های خرد برای ساخت مدل هایی ایجاد می شود که روابط متغیرها را دوباره ایجاد می کند و سپس بر اساس مدل ها جمعیت شبیه سازی شده ایجاد می کند. دانشمندان تحقیقات خود را با استفاده از جمعیت شبیه سازی شده – یا داده های مصنوعی – انجام می دهند و سپس ، در صورت تمایل ، آنها را به دفتر سرشماری منتقل می کنند تا داده های واقعی را دوباره بررسی کند تا از صحت تجزیه و تحلیل آنها مطمئن شود.

راگلز گفت كشف های جدید در داده ها از دست خواهد رفت زیرا این مدل ها فقط آنچه را كه قبلاً شناخته شده است ضبط می كنند.

مشکل دیگر این است که داده های مصنوعی می توانند واریانس ها را افزایش دهند ، مانند یک مطالعه بهداشتی که در آن یک نفر مرتباً رفتار پرخطر را انجام می دهد ، اما دیگران این کار را نمی کنند و به نظر می رسد رفتار پرخطر شیوع بیشتری نسبت به آن دارد. جامعه شناسی در دانشگاه کالیفرنیا ، ریورساید.

لارس ویلهوبر ، اقتصاددان دانشگاه کرنل ، که مطالعه ای در مورد این روش انجام داد ، گفت: وی گفت: داده های مصنوعی این امکان را می دهد زیرا از حریم خصوصی محافظت می کند.

ویلهوبر گفت: “در واقع ، شما می توانید جزئیات بسیار بیشتری از داده ها را نسبت به روش های سنتی بدست آورید.”

دفتر سرشماری روز پنجشنبه در بیانیه ای گفت كه در مورد استفاده از داده های مصنوعی در مطالعه جامعه آمریكا تصمیم نهایی نگرفته و از بازخورد محققان استقبال می كند.

اداره سرشماری اقدامات اخیر دیگری را نیز برای حفاظت از حریم خصوصی انجام داده است ، که در برابر گسترش منابع داده های خارجی به طور فزاینده ای دشوار شده است. در سال جاری ، دفتر پیشنهاد كرد كه هنگام تعریف منطقه شهری ، از واحدهای مسكونی به جای افراد استفاده شود. و انتقادات شدیدی را نسبت به استفاده از تکنیک آماری موسوم به “مصونیت دیفرانسیل” در داده های سرشماری سال 2020 که برای تهیه مناطق کنگره و قانونگذاری استفاده خواهد شد ، برانگیخته است.

رازداری محرمانه “سر و صدا” یا خطاهای عمدی ریاضی را به داده ها اضافه می کند تا ضمن فراهم کردن اطلاعات معتبر آماری ، هویت فرد را پنهان کند. این امر در دادگاهی در آلاباما مورد اعتراض قرار گرفته است كه می گوید استفاده از آن منجر به داده های نادرست خواهد شد.

مارگو آندرسون ، مورخ ، استاد دانشگاه ویسکانسین-میلواکی ، گفت: “اداره سرشماری می گوید این برای حفظ حریم خصوصی به روشی است که آنها همیشه انجام داده اند”. “گروهی از منتقدان در حال رشد هستند که می گویند کاملا متفاوت است. آنها می گویند ، “شما هرگز داده ها را عمداً نادرست نکرده اید.”

اداره سرشماری برای اولین بار ایده استفاده از داده های ترکیبی را سه سال پیش آغاز کرد ، اما پس از آنکه دولت ترامپ نتوانست مسئله شهروندی را به پرسشنامه سرشماری سال 2020 اضافه کند ، نگرانی ها و سیاست های مختلف تغییر یافت.

از نظر سوانسون ، تلاش های دفتر سرشماری یادآور همان جمله ای است كه خبرنگار پیتر آرنت در زمان جنگ ویتنام به یك مقام ارتش آمریكا كه نامش ذکر نشده ، نسبت داده است: “ما برای نجات آن باید شهر را ویران می كردیم.”

سوانسون گفت: “من فکر می کنم آنها به معنای واقعی کلمه داده های سرشماری را از بین می برند تا آنها را از یک تهدید نامطمئن نجات دهند.” “اگر آنها داده ها را نابود کنند ، میز کار را از بین می برند.”

———

مایک اشنایدر را در توییتر در دنبال کنید https://twitter.com/MikeSchneiderAP



[ad_2]

منبع: stop-news.ir

ایندکسر