Зерттеу мақалалары
Ғылымды өзгерткен еңбектер — қазақша түсіндірмемен
AI, ML, ANN және DL айырмасын, model-building pipeline-ін және explainability, drift, bias сияқты өндірістік тәуекелдерді бір картаға жинайтын fundamentals мақала.
Фактчекерді алмастыру емес, оның workflow-ін жылдамдату: checkworthiness, бұрын тексерілген claim-ді табу, evidence retrieval және ассистивті verification міндеттерін жүйелейтін survey.
Drug discovery-де explainability тек model transparency емес: medicinal chemist-ке structural rationale, uncertainty және actionable hypothesis беру үшін XAI әдістерін жүйелейтін шолу.
Pretraining дерегі шектелгенде, жаңа өсу осі керек: бұл жұмыс RL-ді LLM-дермен өндірістік масштабта қалай жүргізуге болатынын және reasoning сапасын қалай көтеретінін көрсетеді.
Any-to-any мультимодаль жүйе: text/image/video/audio комбинацияларында түсіну және сол модальдардың өзінде контент генерациялау; heavy backbone-тарды freeze етіп, ~1% adaptor қабаттарын ғана баптайды.
BERT-тен ChatGPT-ке дейінгі foundation model дәуірін: компоненттер (data/objective/adaptation), модальдар (text/vision/graph) және fundamentals (efficiency/security/privacy) бойынша жүйелейтін кең шолу.
Рекурентті желілерсіз, тек «назар аудару» арқылы тілді параллель өңдеу мүмкін екенін дәлелдеді.
Үлкен тіл моделі дұрыс prompt берілсе — аз ғана мысалмен жаңа тапсырманы үйренгендей нәтиже көрсете алатынын дәлелдеді.
Үлкен модельді “үлкейту” жеткіліксіз: адам бағалауына сүйеніп fine-tune жасасаңыз, кіші модельдің өзі пайдалырақ әрі қауіпсізірек болуы мүмкін.
GenAI қолдануы әлеуметтік/мінез-құлық ғылымдарында жарияланым санын айтарлықтай арттырып, сапаны да аздап көтеруі мүмкін екенін DiD талдаумен көрсетеді.
LLM-ді идеядан бастап код жазу, эксперимент жүргізу, нәтижені визуалдау, толық мақала жазу және симуляцияланған peer review-ге дейін жеткізетін тұтас “research loop” ұсынады.
Бұл survey генеративті модельдердің эволюциясын (GAN-нан ChatGPT-ке дейін) жүйелеп, мәтін/сурет және мультимодаль AIGC-тің негізгі компоненттері мен ашық мәселелерін жинақтайды.
Gemini негізіндегі Med‑Gemini модельдерін медициналық мәтін+сурет+ұзын контекст тапсырмаларында бағалап, бірқатар бенчмаркта GPT‑4V-тан айтарлықтай озып, кей тапсырмаларда мамандардан да асып түсуі мүмкін екенін көрсетеді.
Knowledge graph (KG) — тек “граф база” емес: ол entity-лер мен қатынастарды біріктіріп, іздеу, интеграция және reasoning-ке мүмкіндік береді. Бұл обзор KG құру pipeline-ін, қолдану салаларын және басты қиындықтарды жинақтайды.
LLM-дар жоспарлау/логикалық reasoning-ті «нақты шығара ма», әлде web-scale білімнен ықтимал түрде «қалпына келтіре ме»? Бұл жұмыс planning тесттері мен obfuscation сияқты бақылаулар арқылы скептик аргумент береді және LLM‑Modulo (external verifier) тәсілін ұсынады.
Саяси bias-ты абстракт ұғым емес, өлшенетін сигналға айналдырып: ~500 prompt, 5 ось, production-трафикпен бағалау сияқты практикалық әдіс ұсынады.
Компьютерлік көруде deep learning дәуірін бастаған серпіліс: ImageNet-та үлкен айырмашылық көрсетті.
Пиксельден бастап әрекетке дейін: reinforcement learning-ді нейрондық желімен біріктірді.
Bidirectional pretraining арқылы NLP-дің көптеген міндеттерін бір модельмен көтерді.
Екі модельдің бәсекесі арқылы жаңа дерек (сурет, дыбыс) генерациялау тәсілін ұсынды.