Иной разум. Как «думает» искусственный интеллект? - Андрей Владимирович Курпатов
199
Craig A. D. How do you feel — now? The anterior insula and human awareness // Nature Reviews. Neuroscience. 2009. Vol. 10(1). P. 59–70. DOI: 10.1038/nrn2555.
200
Saxe R, Kanwisher N. People thinking about thinking people. The role of the temporo-parietal junction in “theory of mind”. Neuroimage. 2003 Aug;19(4):1835–42.
201
Amodio D. M., Frith C. D. Meeting of minds: the medial frontal cortex and social cognition // Nature reviews. Neuroscience. 2006. Vol. 7(4). P. 268–277. DOI: 10.1038/nrn1884.
202
Eisenberger N. I., Lieberman M. D. Why rejection hurts: a common neural alarm system for physical and social pain // Trends in cognitive sciences. 2004. Vol. 8(7). P. 294–300. DOI: 10.1016/j.tics.2004.05.010.
203
Kringelbach M. L., Rolls E. T. The functional neuroanatomy of the human orbitofrontal cortex: evidence from neuroimaging and neuropsychology // Progress in neurobiology. 2004. Vol. 72(5). P. 341–372. DOI: 10.1016/j.pneurobio.2004.03.006.
204
«Проблема выравнивания» (alignment problem) в её современном виде была детально представлена Н. Бостромом и заключается в фундаментальной сложности полной и точной спецификации человеческих ценностей таким образом, чтобы сверхразумный агент, следуя им буквально, не пришёл к катастрофическим последствиям.
205
Бостром Н. Искусственный интеллект. Этапы. Угрозы. Стратегии / пер. с англ. С. Филина. М.: Манн, Иванов и Фербер, 2016. 496 с.
206
Kirk R., Squires R. Zombies v. Materialists // Aristotelian Society. 1974. Supplementary Volume 48(1). P. 135–164
207
Барон-Коэн С. Искатели закономерностей: как аутизм способствует человеческой изобретательности / пер. с англ. М. Смирновой. М.: Альпина-нон-фикшн, 2023. 320 с.
208
Baron-Cohen S., Leslie A. M., Frith U. Does the autistic child have a “theory of mind”? // Cognition. 1985. Vol. 21(1). P. 37–46. DOI: 10.1016/0010–0277(85)90022–8.
209
Baron-Cohen S. Mindblindness: An essay on autism and theory of mind. Cambridge (Mass.): MIT press, 1997. xxii, 171 p.
210
Brown T. B. et al. Language models are few-shot learners.
211
Lewis P. et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks // Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 9459–9474.
212
Ouyang L. et al. Training language models to follow instructions with human feedback.
213
Bai Y. et al. Constitutional AI: Harmlessness from AI Feedback // arXiv preprint. 2022. DOI: 10.48550/arXiv.2212.08073.
214
Именно материалы этого исследования использовались затем компанией Cambridge Analytica для влияния на мнение людей во время голосования по Brexit и на выборах президента США в 2016 году.
215
Kosinski M., Stillwell D., Graepel T. Private traits and attributes are predictable from digital records of human behavior // Proceedings of the National Academy of Sciences of the United States of America. 2013. Vol. 110(15). P. 5802–5805. DOI: 10.1073/pnas.1218772110.
216
Kosinski M. Theory of mind may have spontaneously emerged in large language models // arXiv preprint. 2023. DOI:10.48550/arXiv.2302.02083.
217
Ullman T. Large language models fail on trivial alterations of classic theory-of-mind tasks // arXiv preprint. 2023. DOI: 10.48550/arXiv.2302.08399.
218
Станиславский К. С. Собрание сочинений: в 9 т. Т. 4: Работа актёра над ролью / cост., вступ. ст., подгот. текста, коммент. И. Н. Виноградской. М.: Искусство, 1991. 398 с.
219
Станиславский К. С. Собрание сочинений: в 9 т. Т. 3: Работа актёра над собой. Ч. 2. Работа над собой в творческом процессе воплощения / вступ. ст. Б. А. Покровского; коммент. В. В. Дыбовского, Г. В. Кристи. М.: Искусство, 1990. 505 с.
220
Вейнингер О. Пол и характер: принципиальное исследование. М.: Изд. центр «Терра», 1992. 480 с.
221
Фрейд А. Психология Я и защитные механизмы / пер. с нем. М.: Педагогика-Пресс, 1993. 142 с.
222
Ganguli D. et al. Red teaming language models to reduce harms: methods, scaling behaviors, and lessons learned // arXiv preprint. 2022. DOI: 10.48550/arXiv.2209.07858.
223
Paulhus D. L., Williams K. M. The Dark Triad of personality: Narcissism, Machiavellianism, and psychopathy // Journal of research in personality. 2002. Vol. 36(6). P. 556–563. DOI: 10.1016/S0092–6566(02)00505–6.
224
Singer T., Klimecki O. M. Empathy and compassion // Current biology. 2014. Vol. 24(18). P. R875–R878. DOI: 10.1016/ j.cub.2014.06.054.




