هوش مصنوعی در هر گوشه ای از تحقیقات بیوتکنولوژی و داروسازی راه خود را پیدا می کند، اما مانند سایر صنایع، پیاده سازی آن هرگز آنقدر ساده نیست که می خواهید. Converge Bio ابزاری را برای شرکت ها ساخته است تا LLM های متمرکز بر زیست شناسی خود را از “غنی کردن” داده هایشان تا توضیح پاسخ هایشان را عملی کنند. این شرکت 5.5 میلیون دلار در مرحله اولیه جمع آوری کرده است تا محصول خود را توسعه دهد.
«مدل فقط یک مدل است. این کافی نیست.» باید خط لوله ای ایجاد شود تا شرکت ها بتوانند واقعاً از این مدل در فرآیند تحقیق و توسعه خود استفاده کنند. بازار بسیار پراکنده است، اما داروسازی و بیوتکنولوژی میخواهند این فناوری را به صورت تلفیقی، در یک مکان مصرف کنند. ما می خواهیم آن مکان باشیم.»
اگر شما یک مهندس یادگیری ماشین نیستید که در زمینه کشف دارو کار می کند، ممکن است این مشکل برای شما آشنا نباشد. اما اساساً مدلهای بنیادی قدرتمندی وجود دارد، مدلهای زبانی بزرگی که نه بر روی کتابها و اینترنت، بلکه بر روی پایگاههای داده عظیم DNA، ساختارهای پروتئینی و ژنومیک آموزش دیدهاند.
اینها مدلهای قدرتمند و همهکاره هستند، اما مانند LLMهای مورد استفاده در محصولاتی مانند ChatGPT و Cursor، نیاز به کار زیادی دارند تا شکلی پیدا کنند که مردم واقعاً بتوانند از آن استفاده کنند. این کار به ویژه در حوزه های تخصصی مانند میکروبیولوژی یا ایمونولوژی دشوار است. گرفتن یک LLM “خام” آموزش دیده بر روی میلیاردها توالی پروتئین و تبدیل آن به چیزی که یک فناوری آزمایشگاهی می تواند به عنوان بخشی از تحقیقات عادی خود از آن استفاده کند، یک مشکل غیر ضروری است.
به عنوان مثال، گرتز تحقیقات آنتی بادی را پیشنهاد کرد. یک LLM آموزش دیده بر روی بیولوژی خاص آنتی بادی وجود دارد، اما بسیار عمومی است. Converge Bio مجموعه ای از پیشرفت ها را ارائه می دهد که می توانند به صورت ایمن و با استفاده از IP خود شرکت انجام شوند.
اول “غنی سازی داده ها” است که آنتی بادی LLM را با داده های مرتبط مهمی مانند برهمکنش های آنتی ژن-آنتی بادی و پروتئین-پروتئین تقویت می کند. سپس، با دانش خاص تر، می توان آن را روی آنتی ژن خاصی که تیم به دنبال هدف قرار دادن آن است تنظیم کرد و ممکن است داده های درون ظرفی اختصاصی روی آن داشته باشد.
گرتز گفت: “اکنون ما یک برنامه کاربردی داریم: ورودی یک دنباله است، خروجی یک قرابت الزام آور است.” سپس پلتفرم یک لایه مهم دیگر را فراهم می کند: توضیح پذیری. محققان میتوانند خروجی را بررسی کنند تا نه تنها بفهمند که «این توالی بهتر از این کار میکند»، بلکه در سطح جفت آمینو اسید یا باز، قسمتی از دنباله را که به نظر میرسد باعث بهتر کارکرد آن میشود، بیابند.
در نهایت، توالیهای جدیدی تولید میکند که نتایج بهبود یافتهای را ارائه میکند، همچنین با قابلیت توضیح. گرتز اشاره کرد که توضیح پذیری آنها را با محبوبیت خود در بین مشتریان شگفت زده کرده است – منطقی است، زیرا به متخصصان اجازه می دهد تا تخصص دامنه خود را (مثلاً تعاملات پروتئین) در این منطقه جدیدتر و مبهم تر بیوانفورماتیک و یادگیری ماشین اعمال کنند.
Converge از بسیاری از مدل های منبع باز و رایگان استفاده می کند، اما در حال کار بر روی ساخت مدل های خود نیز است. گرتز گفت که در حال حاضر یک فرآیند اختصاصی برای بخش توضیح پذیری دارد. و «برنامه درسی» غنیسازی دادهها نیز کاملاً متعلق به آنها است – نه یک فرآیند بیاهمیت. او اشاره کرد که روشهای آموزشی یکی از معدود رازهایی است که توسط موفقترین شرکتهای هوش مصنوعی محافظت میشود.
این بخشی از خندقی است که آنها امیدوارند بسازند، همراه با این واقعیت. همانطور که گرتز بیان کرد، “این احتمالاً بزرگترین فرصت در بیوتکنولوژی در پنج دهه اخیر است.”
با این حال، بسیاری از شرکتهای بیوتکنولوژی، شاید اکثر آنها، راهحل اختصاصی برای انجام کارهای مرتبط با LLM در حوزه خود ندارند و به طور فعال به دنبال مواردی هستند که راهحلهای عمومی برای آنها کاربرد ندارد.
گرتز گفت: “ایده این است که همه چیز را برای genAI در بیوتکنولوژی ذخیره کنیم، سپس از آن به عنوان گوه ای برای ارائه بیشتر در طول زمان استفاده کنیم.” رفتار در داروسازی و زیستی این است که وقتی آنها با فروشنده ای که به آن اعتماد دارند ارتباط برقرار می کنند، می خواهند از آنها در موارد دیگر استفاده کنند، چه طراحی آنتی بادی یا طراحی واکسن. به همین دلیل است که فکر می کنم این موقعیت برای این لحظه در بازار بهترین است.”
به نظر می رسد سرمایه گذاران موافق هستند و 5.5 میلیون دلار را در یک دور اولیه به رهبری شرکای TLV قرار دادند.
این شرکت از این پول برای استخدام و جذب مشتریان استفاده خواهد کرد، همانطور که استارت آپ ها اغلب در این مرحله انجام می دهند، اما همچنین مقاله علمی در مورد طراحی آنتی بادی منتشر خواهد کرد (البته با استفاده از سیستم های خود) و آموزش “مدل پایه مناسب”. ”
منبع: techcrunch