Зерттеу мақалалары

Ғылымды өзгерткен еңбектер — қазақша түсіндірмемен

Сүзгілер
БарлығыЖИ / MLNLPБиологияФизика
Electronic Markets 2021
Machine learning and deep learning
AI → ML → ANN → DL fundamentals

AI, ML, ANN және DL айырмасын, model-building pipeline-ін және explainability, drift, bias сияқты өндірістік тәуекелдерді бір картаға жинайтын fundamentals мақала.

Janiesch, Zschech, Heinrich • Electronic Markets
Machine LearningDeep LearningFundamentalsXAI
Жаңадан бастаушы
DOI:10.1007/s12525-021-00475-2
Толығырақ →LIVE
arXiv 2021
Automated Fact-Checking for Assisting Human Fact-Checkers
Human‑in‑the‑loop pipeline

Фактчекерді алмастыру емес, оның workflow-ін жылдамдату: checkworthiness, бұрын тексерілген claim-ді табу, evidence retrieval және ассистивті verification міндеттерін жүйелейтін survey.

Nakov және т.б. • Survey
Fact-CheckingNLPIRMisinformation
Орта
arXiv:2103.07769
Толығырақ →LIVE
arXiv 2020
Drug discovery with explainable artificial intelligence
XAI for medicinal chemistry

Drug discovery-де explainability тек model transparency емес: medicinal chemist-ке structural rationale, uncertainty және actionable hypothesis беру үшін XAI әдістерін жүйелейтін шолу.

Jiménez-Luna, Grisoni, Schneider • ETH Zurich
Drug DiscoveryXAIQSARGNN
Орта
arXiv:2007.00523
Толығырақ →LIVE
arXiv 2025
Kimi k1.5: Scaling Reinforcement Learning with LLMs
RL масштабтау + long context + long2short

Pretraining дерегі шектелгенде, жаңа өсу осі керек: бұл жұмыс RL-ді LLM-дермен өндірістік масштабта қалай жүргізуге болатынын және reasoning сапасын қалай көтеретінін көрсетеді.

Kimi Team және т.б. • Moonshot AI
RLReasoningLong ContextMultimodal
Сарапшы
2025-06-03
Толығырақ →LIVE
arXiv 2024
NExT-GPT: Any-to-Any Multimodal LLM
LLM + adaptors + diffusion decoders

Any-to-any мультимодаль жүйе: text/image/video/audio комбинацияларында түсіну және сол модальдардың өзінде контент генерациялау; heavy backbone-тарды freeze етіп, ~1% adaptor қабаттарын ғана баптайды.

Wu, Fei, Qu, Ji, Chua • NUS (NExT++)
MultimodalDiffusionAdaptersAgents
Орта
arXiv:2309.05519v3
Толығырақ →LIVE
arXiv 2023
A Comprehensive Survey on Pretrained Foundation Models: A History from BERT to ChatGPT
Foundation Models тарихы + taxonomy

BERT-тен ChatGPT-ке дейінгі foundation model дәуірін: компоненттер (data/objective/adaptation), модальдар (text/vision/graph) және fundamentals (efficiency/security/privacy) бойынша жүйелейтін кең шолу.

Ce Zhou және т.б. • Multi-institution survey
Foundation ModelsSurveyBERTChatGPT
Орта
arXiv:2302.09419v3
Толығырақ →LIVE
NeurIPS 2017
Attention Is All You Need
Transformer архитектурасының бастауы

Рекурентті желілерсіз, тек «назар аудару» арқылы тілді параллель өңдеу мүмкін екенін дәлелдеді.

Vaswani және т.б. • Google Brain
TransformerSelf-AttentionLLMNLP
Орта
100K+ сілтеме
Толығырақ →LIVE
NeurIPS 2020
Language Models are Few-Shot Learners
GPT-3 және in-context learning

Үлкен тіл моделі дұрыс prompt берілсе — аз ғана мысалмен жаңа тапсырманы үйренгендей нәтиже көрсете алатынын дәлелдеді.

Brown және т.б. • OpenAI
GPT-3Few-shotIn-contextLLM
Орта
NeurIPS 2020
Толығырақ →LIVE
arXiv 2022
Training language models to follow instructions with human feedback
InstructGPT (RLHF)

Үлкен модельді “үлкейту” жеткіліксіз: адам бағалауына сүйеніп fine-tune жасасаңыз, кіші модельдің өзі пайдалырақ әрі қауіпсізірек болуы мүмкін.

Ouyang және т.б. • OpenAI
RLHFInstructGPTSFTReward Model
Орта
arXiv:2203.02155
Толығырақ →LIVE
arXiv 2025
Can GenAI Improve Academic Performance? Evidence from the Social and Behavioral Sciences
Ғылыми өнімділік пен сапаға әсер

GenAI қолдануы әлеуметтік/мінез-құлық ғылымдарында жарияланым санын айтарлықтай арттырып, сапаны да аздап көтеруі мүмкін екенін DiD талдаумен көрсетеді.

Filimonovic, Rutzer, Wunsch • arXiv
GenAIDiDProductivityScience of Science
Орта
arXiv:2510.02408v1
Толығырақ →LIVE
arXiv 2024
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
Ғылыми зерттеуді толық автоматтандыруға қадам

LLM-ді идеядан бастап код жазу, эксперимент жүргізу, нәтижені визуалдау, толық мақала жазу және симуляцияланған peer review-ге дейін жеткізетін тұтас “research loop” ұсынады.

Chris Lu және т.б. • Sakana AI (open-source)
AI AgentsAutomationResearch LoopPeer Review
Сарапшы
arXiv:2408.06292
Толығырақ →LIVE
arXiv 2023
A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT
Generative AI тарихы: GAN → Diffusion → Transformer

Бұл survey генеративті модельдердің эволюциясын (GAN-нан ChatGPT-ке дейін) жүйелеп, мәтін/сурет және мультимодаль AIGC-тің негізгі компоненттері мен ашық мәселелерін жинақтайды.

Cao, Li, Liu, Yan, Dai, Yu, Sun • arXiv
AIGCGANDiffusionChatGPT
Жаңадан бастаушы
arXiv:2303.04226
Толығырақ →LIVE
arXiv 2024
Capabilities of Gemini Models in Medicine
Med‑Gemini: мультимодаль медицина

Gemini негізіндегі Med‑Gemini модельдерін медициналық мәтін+сурет+ұзын контекст тапсырмаларында бағалап, бірқатар бенчмаркта GPT‑4V-тан айтарлықтай озып, кей тапсырмаларда мамандардан да асып түсуі мүмкін екенін көрсетеді.

Saab және т.б. • Google/DeepMind
GeminiMedicineMultimodalLong Context
Орта
arXiv:2404.18416
Толығырақ →LIVE
arXiv 2023
Knowledge Graphs: Opportunities and Challenges
KG: дерек → граф → reasoning

Knowledge graph (KG) — тек “граф база” емес: ол entity-лер мен қатынастарды біріктіріп, іздеу, интеграция және reasoning-ке мүмкіндік береді. Бұл обзор KG құру pipeline-ін, қолдану салаларын және басты қиындықтарды жинақтайды.

Peng, Xia, Naseriparsa, Osborne • arXiv
Knowledge GraphGraph MLReasoningData Integration
Орта
arXiv:2303.13948
Толығырақ →LIVE
arXiv / Annals NYAS • 2024
Can Large Language Models Reason and Plan?
LLM ≈ approximate retrieval, жоспарлау ≠ «әдемі мәтін»

LLM-дар жоспарлау/логикалық reasoning-ті «нақты шығара ма», әлде web-scale білімнен ықтимал түрде «қалпына келтіре ме»? Бұл жұмыс planning тесттері мен obfuscation сияқты бақылаулар арқылы скептик аргумент береді және LLM‑Modulo (external verifier) тәсілін ұсынады.

Subbarao Kambhampati • ASU
ReasoningPlanningVerificationLLM-Modulo
Орта
arXiv:2403.04121
Толығырақ →LIVE
OpenAI • 2025
Defining and evaluating political bias in LLMs
Саяси бейтараптықты өлшеу фреймворкі

Саяси bias-ты абстракт ұғым емес, өлшенетін сигналға айналдырып: ~500 prompt, 5 ось, production-трафикпен бағалау сияқты практикалық әдіс ұсынады.

OpenAI • ResearchPublication
BiasEvaluationSafetyChatGPT
Орта
2025-10-09
Толығырақ →LIVE
NeurIPS 2012Жақында
ImageNet Classification with Deep Convolutional Neural Networks
AlexNet

Компьютерлік көруде deep learning дәуірін бастаған серпіліс: ImageNet-та үлкен айырмашылық көрсетті.

Krizhevsky және т.б. • University of Toronto
CNNImageNetVision
Жаңадан бастаушы
Жақында
Толығырақ →SOON
NIPS 2013Жақында
Playing Atari with Deep Reinforcement Learning
DQN

Пиксельден бастап әрекетке дейін: reinforcement learning-ді нейрондық желімен біріктірді.

Mnih және т.б. • DeepMind
RLDQNAtari
Орта
Жақында
Толығырақ →SOON
NAACL 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
MLM + NSP + encoder-only pretraining

Bidirectional pretraining арқылы NLP-дің көптеген міндеттерін бір модельмен көтерді.

Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova • Google
BERTMLMEncoder-onlyPretraining
Орта
arXiv:1810.04805
Толығырақ →LIVE
NeurIPS 2014Жақында
Generative Adversarial Nets
GANs

Екі модельдің бәсекесі арқылы жаңа дерек (сурет, дыбыс) генерациялау тәсілін ұсынды.

Goodfellow және т.б. • Université de Montréal
GANGenerativeVision
Сарапшы
Жақында
Толығырақ →SOON