Зерттеу мақалалары

Ғылымды өзгерткен еңбектер — қазақша түсіндірмемен

Іздеу(қазір тек дизайн)

Сүзгілер

БарлығыЖИ / MLNLPБиологияФизика

Electronic Markets 2021

AI, ML, ANN және DL айырмасын, model-building pipeline-ін және explainability, drift, bias сияқты өндірістік тәуекелдерді бір картаға жинайтын fundamentals мақала.

Janiesch, Zschech, Heinrich • Electronic Markets

Machine LearningDeep LearningFundamentalsXAI

Жаңадан бастаушы

DOI:10.1007/s12525-021-00475-2

Толығырақ →LIVE

arXiv 2021

Automated Fact-Checking for Assisting Human Fact-Checkers

Human‑in‑the‑loop pipeline

Фактчекерді алмастыру емес, оның workflow-ін жылдамдату: checkworthiness, бұрын тексерілген claim-ді табу, evidence retrieval және ассистивті verification міндеттерін жүйелейтін survey.

Nakov және т.б. • Survey

Fact-CheckingNLPIRMisinformation

Drug discovery with explainable artificial intelligence

XAI for medicinal chemistry

Drug discovery-де explainability тек model transparency емес: medicinal chemist-ке structural rationale, uncertainty және actionable hypothesis беру үшін XAI әдістерін жүйелейтін шолу.

Jiménez-Luna, Grisoni, Schneider • ETH Zurich

Drug DiscoveryXAIQSARGNN

Kimi k1.5: Scaling Reinforcement Learning with LLMs

RL масштабтау + long context + long2short

Pretraining дерегі шектелгенде, жаңа өсу осі керек: бұл жұмыс RL-ді LLM-дермен өндірістік масштабта қалай жүргізуге болатынын және reasoning сапасын қалай көтеретінін көрсетеді.

Kimi Team және т.б. • Moonshot AI

RLReasoningLong ContextMultimodal

NExT-GPT: Any-to-Any Multimodal LLM

LLM + adaptors + diffusion decoders

Any-to-any мультимодаль жүйе: text/image/video/audio комбинацияларында түсіну және сол модальдардың өзінде контент генерациялау; heavy backbone-тарды freeze етіп, ~1% adaptor қабаттарын ғана баптайды.

Wu, Fei, Qu, Ji, Chua • NUS (NExT++)

MultimodalDiffusionAdaptersAgents

A Comprehensive Survey on Pretrained Foundation Models: A History from BERT to ChatGPT

Foundation Models тарихы + taxonomy

BERT-тен ChatGPT-ке дейінгі foundation model дәуірін: компоненттер (data/objective/adaptation), модальдар (text/vision/graph) және fundamentals (efficiency/security/privacy) бойынша жүйелейтін кең шолу.

Ce Zhou және т.б. • Multi-institution survey

Foundation ModelsSurveyBERTChatGPT

Attention Is All You Need

Transformer архитектурасының бастауы

Рекурентті желілерсіз, тек «назар аудару» арқылы тілді параллель өңдеу мүмкін екенін дәлелдеді.

Vaswani және т.б. • Google Brain

TransformerSelf-AttentionLLMNLP

Language Models are Few-Shot Learners

GPT-3 және in-context learning

Үлкен тіл моделі дұрыс prompt берілсе — аз ғана мысалмен жаңа тапсырманы үйренгендей нәтиже көрсете алатынын дәлелдеді.

Brown және т.б. • OpenAI

GPT-3Few-shotIn-contextLLM

Training language models to follow instructions with human feedback

InstructGPT (RLHF)

Үлкен модельді “үлкейту” жеткіліксіз: адам бағалауына сүйеніп fine-tune жасасаңыз, кіші модельдің өзі пайдалырақ әрі қауіпсізірек болуы мүмкін.

Ouyang және т.б. • OpenAI

RLHFInstructGPTSFTReward Model

Can GenAI Improve Academic Performance? Evidence from the Social and Behavioral Sciences

Ғылыми өнімділік пен сапаға әсер

GenAI қолдануы әлеуметтік/мінез-құлық ғылымдарында жарияланым санын айтарлықтай арттырып, сапаны да аздап көтеруі мүмкін екенін DiD талдаумен көрсетеді.

Filimonovic, Rutzer, Wunsch • arXiv

GenAIDiDProductivityScience of Science

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Ғылыми зерттеуді толық автоматтандыруға қадам

LLM-ді идеядан бастап код жазу, эксперимент жүргізу, нәтижені визуалдау, толық мақала жазу және симуляцияланған peer review-ге дейін жеткізетін тұтас “research loop” ұсынады.

Chris Lu және т.б. • Sakana AI (open-source)

AI AgentsAutomationResearch LoopPeer Review

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Generative AI тарихы: GAN → Diffusion → Transformer

Бұл survey генеративті модельдердің эволюциясын (GAN-нан ChatGPT-ке дейін) жүйелеп, мәтін/сурет және мультимодаль AIGC-тің негізгі компоненттері мен ашық мәселелерін жинақтайды.

Cao, Li, Liu, Yan, Dai, Yu, Sun • arXiv

AIGCGANDiffusionChatGPT

Capabilities of Gemini Models in Medicine

Med‑Gemini: мультимодаль медицина

Gemini негізіндегі Med‑Gemini модельдерін медициналық мәтін+сурет+ұзын контекст тапсырмаларында бағалап, бірқатар бенчмаркта GPT‑4V-тан айтарлықтай озып, кей тапсырмаларда мамандардан да асып түсуі мүмкін екенін көрсетеді.

Saab және т.б. • Google/DeepMind

GeminiMedicineMultimodalLong Context

Knowledge Graphs: Opportunities and Challenges

KG: дерек → граф → reasoning

Knowledge graph (KG) — тек “граф база” емес: ол entity-лер мен қатынастарды біріктіріп, іздеу, интеграция және reasoning-ке мүмкіндік береді. Бұл обзор KG құру pipeline-ін, қолдану салаларын және басты қиындықтарды жинақтайды.

Peng, Xia, Naseriparsa, Osborne • arXiv

Knowledge GraphGraph MLReasoningData Integration

Орта

arXiv:2303.13948

Толығырақ →LIVE

arXiv / Annals NYAS • 2024

Can Large Language Models Reason and Plan?

LLM ≈ approximate retrieval, жоспарлау ≠ «әдемі мәтін»

LLM-дар жоспарлау/логикалық reasoning-ті «нақты шығара ма», әлде web-scale білімнен ықтимал түрде «қалпына келтіре ме»? Бұл жұмыс planning тесттері мен obfuscation сияқты бақылаулар арқылы скептик аргумент береді және LLM‑Modulo (external verifier) тәсілін ұсынады.

Subbarao Kambhampati • ASU

ReasoningPlanningVerificationLLM-Modulo

Defining and evaluating political bias in LLMs

Саяси бейтараптықты өлшеу фреймворкі

Саяси bias-ты абстракт ұғым емес, өлшенетін сигналға айналдырып: ~500 prompt, 5 ось, production-трафикпен бағалау сияқты практикалық әдіс ұсынады.

OpenAI • ResearchPublication

BiasEvaluationSafetyChatGPT

Орта