دیپ فیک را میتوان یکی از مهمترین موضوعات دنیای امروز دانست. خطر فناوری مذکور روزبهروز بیشتر در رسانهها دیده میشود و همه از سرعت بالای پیشرفت و در دسترس بودن آن واهمه دارند. پیچیدگی فناوری مذکور در کنار کاربردهای متنوع و بعضا خطرناک آن، دستههای متعدد مردم را نیز به رسانهها بیاعتماد میکند. بههرحال اطلاعرسانی دربارهی خطرات یک فناوری جدید میتواند فوایدی را هم برای عموم جامعه بههمراه داشته باشد.
امروز همه میدانیم که استفادهی سوء از دیپ فیک، چالشهایی را برای جامعه بههمراه خواهد داشت. بهعلاوه با افزایش آگاهی از زمینههای سوءاستفاده، پیشگیری از عواقب آنها نیز آسانتر خواهد بود. البته درنهایت این فناوری توسعه یافته است و در دنیای آیندهی ما حضور جدی خواهد داشت. شاید با نگاهی عمیقتر بتوان کاربردهای مفیدی هم از آن استخراج کرد که به نفع همهی جوامع هم باشند. در ادامهی این مطلب زومیت، به بررسی همین قابلیتهای مفید میپردازیم.
بحث و مناظره پیرامون فناوری دیپ فیک امروز به وضعیت پیچیدهای رسیده است. البته هنوز تعریف و بررسی واحدی از فناوری مذکور وجود ندارد. بههرحال با نگاهی اولیه میتوان دیپ فیک را هرگونه تقلید، دستکاری یا ساخت صوت یا ویدئو نامید که بهکمک یادگیری ماشین ممکن میشود. جابهجایی صورت، حرکت دادن مصنوعی بدن، کپی کردن صدای افراد و تولید اصوات و تصاویر کاملا جدید، همگی در دستهبندی دیپ فیک قرار میگیرند. البته با توجه به چنین تعریفی، نمیتوان تغییر تصاویر ثابت در فتوشاپ را بهعنوان دیپ فیک در نظر گرفت.
داستانگویی از طریق تصاویر متحرک، فعالیتی بسیار گرانقیمت محسوب میشود. استودیوهای هالیوودی امروزه میلیاردها دلار هزینه میکنند تا شخصیتهای ساختگی را در فیلمهای خود اضافه کنند. ابزارهایی که بازیگران بزرگ صنعت رسانه برای تولید محتوا استفاده میکنند، با وجود کاهش قیمت در دهههای اخیر هنوز برای بسیاری از تولیدکنندهها بسیار گران و غیرقابل دسترس هستند. همین ابزارها، استودیوهای بزرگ را قادر میسازند تا تصورات خود را به تولیداتی قابل قبول تبدیل کنند. دراینمیان فناوری دیپ فیک فرایند تولید تصاویر متحرک را آسانتر میکند. درنهایت تولیدکنندههای کوچکتر هم میتوانند با استفاده از دیپ فیک، به ظرفیتی نزدیک به استودیوهای غولپیکر هالیوودی دست پیدا کنند.
Synthesia یکی از شرکتهای فعال در حوزهی دیپ فیک است که محصولی تجاری توسعه میدهد. ابزار آنها از فناوری دیپ فیک برای تغییر زبان ویدئو استفاده میکند. محصول آنها، با متحرکسازی خودکار مجدد صورت، دوبلهی صدا و تصویر را ممکن میکند. دستاورد بزرگ این شرکت در ویدئویی رونمایی شد که دیوید بکام در آن به ۹ زبان زندهی دنیا دربارهی مالاریا صحبت میکند.
علاوهبر نمونهی بالا، میتوان از ابزار سینتزیا برای افزایش توانمندی تولیدکنندههای محتوا در سرتاسر جهان استفاده کرد. بهعنوان مثال اگر هنرمندی بااستعداد، به زبانهای بزرگ رایج در جهان صحبت نکند، دسترسی به چنین ابزاری حکم یک پیشرفت بزرگ را برای او خواهد داشت. با استفاده از دیپ فیک به چنین شکلی، میتوان آثار هر هنرمندی را به زبانهای متعدد بازتولید و پخش کرد.
غول نرمافزارهای گرافیکی جهان، ادوبی، نرمافزاری بهنام Adobe VoCo دارد که اکنون در وضعیت تحقیق و نمونههای اولیه به سر میبرد. این نرمافزار به تولیدکنندهها امکان میدهد که از متن، صوت تولید کرده و آن را با ابزارهایی شبیه به فتوشاپ ویرایش کنند. بهعنوان نمونهای از کاربرد نرمافزار، تولیدکننده میتواند فیلم کوتاه خود را با صدای گویندههای مشهور تولید کند.
تینگوی شو، بنیانگذار و مدیرعامل استارتاپ Humen است که ویدئوهای دیپ فیک با تمرکز روی حرکات موزون تولید میکند. او دربارهی هدف نهایی این فناوری میگوید:
در آیندهای که ما در نظر داریم، همه میتوانند محتوایی باکیفیت در سطح هالیوود تولید کنند.
یوتیوب و اینستاگرام، فاصلهی فرصتهای توزیع و تولید محتوا بین شرکتهای سرگرمی بزرگ و عکاسان حرفهای را با آماتورهای بااستعداد کاهش دادند. بهبیان دیگر امروز استعدادهایی که سرمایههای کمی برای تبلیغات دارند، فرصتهای مناسبی برای رقابت با بازیگران بزرگ پیدا کردهاند. همین روند برای دیپ فیک هم وجود خواهد داشت. تولیدکنندههای آماتور با استفاده از فناوریهای موجود میتوانند فاصلهی خود را با شرکتهای ثروتمند بازار جلوههای بصری کاهش دهند.
احتمالا آیندهی صنعت سرگرمی با دیپ فیک رقم میخورد
یک باور تخصصی دربارهی آیندهی فرهنگ و هنر میگوید که کپی و ترکیب کردن آثار هنری، فرهنگ آینده را شکل میدهد. البته چنین دیدگاهی از سالها قبل و دوران پابلو پیکاسو هم وجود داشت و بزرگانی همچون استیو جابز هم به آن اذعان داشتند. درواقع آنها آیندهی هنر را نه در گرو آثار انحصاری، بلکه وابسته به ترکیب آثار هنرمندان و خلق محصولات جدید میدانند. بههرحال اگر آیندهی فرهنگ را با چنین تصویری در نظر بگیریم، دیپ فیک بهعنوان ابزاری کاربردی برای شکلگیری آن شناخته میشود.
توانایی تغییر چهره، صوت و حالتهای احساسی، یکی از مهمترین مراحل در ساخت انسانهای مجازی خواهد بود؛ انسانهایی که احتمالا در آینده بخش مهمی از ارتباطات ما را شکل میدهند. ما امروز مراحل مهمی را در مسیر ساخت انسانهای مجازی طی میکنیم. دستیارهای شخصی همچون الکسا، کورتانا و سیری از سالها پیش بخشی از تعامل ما با دنیا بودهاند. آنها امروز سهم مناسبی را از لحاظ استفاده در میان کاربران به خود اختصاص دادهاند و روزبهروز هم پیشرفتهتر میشوند. بههرحال با وجود تمام پیشرفتهایی که در توسعهی دستیارهای مجازی صورت گرفته است، امروز باز هم آنها را تنها در حد رابطهای کاربری متنوع میدانیم و هنوز به انسان مجازی مورد نظر تبدیل نشدهاند.
انسانهای مجازی دستاورد مهم دیگر در حوزهی تعاملات کاربر دنیای فناوری
انسانهای مجازی دستاورد مهم دیگری در حوزهی تعاملات کاربر دنیای فناوری هستند که با روشی متفاوت از دستیارهای شخصی به سمت بدنهی جامعه حرکت میکنند. مسیر آنها از سمت اینفلوئنسرهای دیجیتال دنبال میشود؛ اینلفوئنسرهایی که در دستهی انسانهای مجازی قابل باور قرار میگیرند. آنها نوعی از ارتباط را ایجاد میکنند که به رفتارهای انسانی عموم جامعه نزدیکتر است.
بهعنوان نمونهای از اینفلوئنسرهای دیجیتال میتوان به Lil Miquela یا Astro در اینستاگرام اشاره کرد که ارتباطی طبیعی و نزدیک با کاربران دارند. البته پاسخ آنها به کاربران و تعاملهای مربوطه، توسط افراد دیگر و انسانهای واقعی نوشته میشود؛ اما رویکردهای موجود نشان از آیندهای دارند که انسانهای مجازی به پدیدهای رایج در شبکههای مجازی تبدیل شوند.
بیشتر بخوانید:فناوری دیپ فیک و سقوط اخلاقیات
دیپ فیک میتواند فاصلهی میان دستیارهای مجازی و اینفلوئنسرهای دیجیتال را از بین ببرد. پیشرفت موجوداتی همچون الکسا یا لیل میکولا و تبدیل کردن آنها به موجودی همچون سامانتا در فیم Her یا جوی در فیلم Blade runner 2049، نیازمند پیشرفتهای بیشتر در شبیهسازی صوت و تصویر خواهد بود؛ پیشرفت در حوزههایی همچون نشان دادن زبان بدن، صوت و احساسات که بیش از همیشه باید شبیه به انسان واقعی شود.
اگر تمامی ترکیبهای منحصربهفرد حرکت، بازخورد صوتی و حالت چهرهی یک فرد را در طول زندگی بشماریم، به عددی در مقیاس میلیارد خواهیم رسید. درنتیجه برای واقعیتر کردن انسانهای مجازی، نمیتوان عملکرد آنها را با رویکردهای سنتی کدنویسی طراحی کرد و باید روشهایی بسیار انعطافپذیرتر به کار برد.
فناوری دیپ فیک میلیاردها نمونه از رفتارهای انسانی را دریافت و رفتارهایی بسیار شبیه به واقعیت را بهعنوان خروجی ارائه میکند. با دیپ فیک میتوان امکان و ظرفیت تعامل و درک طبیعیتر مکالمه را به دستیارهای هوشمند اضافه کرد. بههمینترتیب اینفلوئنسرهای مجازی هم توانایی تعامل تصویری واقعیتر و زنده را پیدا خواهند کرد. در آیندهی تحت سلطهی دیپ فیک میتوان زنده شدن شخصیتهایی همچون میکی ماوس را متصور شد. تصاویر هولوگرام سهبعدی از کاراکترهای انیمیشنی و انسانهای واقعی که توانایی صحبت با صدایی واقعی دارند، بخش دیگری از آیندهی مذکور خواهد بود.
خلاقیت را میتوان محصولی از دل کپی کردن نامید. جزئیات بیشتر و پیشرفت در هنر هم از دل همین فرایند بیرون میآیند. چنین دستاوردهایی بسیار نزدیک به محصولات دیپ فیک هستند. فناوریهایی که دسترسی به ابزارهای خلاقانهی سرگرمی را برای همه ممکن کرده و تولید انواع جدیدی از محتوا را آسان میکنند. با توجه به همهی این نکات، شاید بتوان کمی از ترس و نگرانی پیرامون دیپ فیک کاست و آیندهای روشنتر را متصور شد.
هزینه میلیاردی فیسبوک برای تشخیص محتوای دیپ فیک
فیسبوک به فرد یا گروهی که فناوری کاربردی برای تشخیص محتوای دیپ فیک توسعه دهند، جایزهی نقدی اهدا میکند. بهعلاوه آنها انواع محتوای دیپ فیک را تولید میکنند تا شرکتکنندهها در رقابت، دادهی اولیه برای آزمایش داشته باشند.
چالش تشخیص محتوای دیپ فیک (Deepfake Detection Challenge) برنامهای مشارکتی با حضور فیسبوک، مایکروسافت، سازمان The Partnership on AI و فعالان دانشگاهی است. فیسبوک در همکاری مذکور، ۱۰ میلیون دلار سرمایهگذاری کرده است. هدف این برنامه، کمک به شناسایی و اعمال نظر دربارهی ویدئوها و محتوای رسانهای دیگری تعریف شد که برای نشان دادن فعالیتی غیرواقعی توسط یک فرد بهخصوص، دستکاری میشوند؛ محتوایی که بهنام دیپ فیک شناخته میشود.
مایک شروپفر، مدیر فناوری بخش هوش مصنوعی فیسبوک در یک پست وبلاگی دربارهی برنامهی جدید شرکتش نوشت:
هدف چالش، تولید یک فناوری است که هر فرد بتواند با استفاده از آن، سوءاستفاده از هوش مصنوعی در تغییر محتوای ویدئویی را تشخیص دهد؛ سوءاستفادهای که عموما با هدف گمراهکردن مخاطب صورت میگیرد.
همانطور که گفته شد، در چالش تشخیص محتوای دیپ فیک از دستهای محتوای اختصاصی برای بررسی و تمرین فناوری شرکتکنندهها استفاده میشود. فیسبوک از ویدئوهای جدید در این چالش استفاده میکند که بازیگرانی با پرداخت هزینه در آن شرکت کردهاند. به بیان دیگر، بههیچوجه از دادههای شخصی کاربران فیسبوک در چالش استفاده نخواهد شد. فیسبوک برای تأمین محتوای آزمایشی شرکتکنندهها، ویدئوهای اصلاحشده و اصلاحنشدهی متعددی تولید میکند تا سیستمهای طراحیشده را به چالش بکشند. درنهایت چنین چالشها و مسابقههایی به کمک شبکههای اجتماعی میآیند تا روشی برای تشخیص محتوای دستکاریشده (پیش از گسترش زیاد) توسعه دهند.
هزینهای که شرکتهای حاضر در برنامه پرداخت میکنند، برای کمک به روند تحقیقات هم استفاده میشود. درواقع هزینهی ۱۰ میلیون دلاری فیسبوک در پروژهی حاضر، تنها برای اهدای جایزه نیست و به تأمین نیازهای مالی گروههای تحقیقاتی هم اختصاص خواهد یافت. رسانهی دیجیتال ترندز در همین موضوع مصاحبهای با سخنگوی فیسبوک داشت که او در پاسخ گفت:
مجموع ۱۰ میلیون دلار سرمایهگذاری فیسبوک بهصورت کمکهای مالی دانشگاهی، جایزههای مخصوص چالش، هزینهی برگزاری ورکشاپ و ساخت دیتاست جدید پرداخت میشود. بههرحال ما تلاش میکنیم تا توسعهی هرچه بیشتر دیتاست را ادامه دهیم و از جامعهی محققان حمایت داشته باشیم.
دیپ فیک، فناوری جدیدی است که امسال رشد قابلتوجهی را از لحاظ فنی و حتی توجه رسانهای تجربه کرد. تاکنون نمونههای متعددی از این فناوری دیدهایم که چالشهای رسانهای متعددی هم برای شخصیتهای مشهور ایجاد کردهاند. بهعنوان مثال، چندی پیش یک ویدئوی دیپ فیک از مارک زاکربرگ پخش شد. مدیرعامل فیسبوک در ویدئوی تقلبی مذکور صحبتهایی پیرامون سلطهی بالای شرکتش روی دادههای میلیونها کاربر مطرح میکرد. متخصصان اعتقاد دارند فناوری دیپ فیک با سرعت بالایی پیشرفت میکند و ویدئوهای دیپ فیک در سالهای پیشرو طبیعیتر و قانعکنندهتر خواهند شد.
متخصصان دنیای فناوری اعتقاد دارند، برنامههایی همچون چالش موجود برای جلوگیری از توزیع محتوای خرابکارانهی دیپ فیک اهمیت و کاربرد بالایی دارند. فیلیپ ایزولا، استادیار مهندسی برق و علوم کامپیوتر در دانشگاه MIT دربارهی جلوگیری از کاربرد غلط دیپ فیک میگوید:
فناوری دستکاری تصاویر سریعتر از توان ما در تشخیص واقعیت از دروغ پیشرفت میکند. حل کردن مشکلی با چنین ابعادی، قطعا از قدرت یک نفر خارج خواهد بود. مسابقهها و رویدادهای عمومی و آزاد مانند چالش کنونی، با متمرکز کردن قدرت ذهنی جهانی روی یک مشکل بزرگ، موجب بروز نوآوری میشوند.