Showing posts with label язык. Show all posts
Showing posts with label язык. Show all posts

Saturday, November 24, 2012

Из племени, кому жизнь не дорога

“Онегин, добрый мой приятель” - чего ради Онегин добрый? Помните в "Мастер и Маргарита" - “С тех пор, как добрые люди изуродовали его, он стал жесток”. Будем считать, что “добрый” характеризует дистанцию между Пушкиным и Онегиным, они близки.
Теперь, без работы, когда есть время внимательно прочитать и выслушать, и снова прочитать, становится ясно, как много может быть упущено и упущено мною уже.
Посмотрел 18 серий с Валентином Непомнящим, читающим и комментирующим роман “Евгений Онегин”. До просмотра этого замечательного видео-цикла я прочитал и выслушал роман много раз, прочитал комментарии Лотмана, послушал оперу с Хворостовским (была на Культуре), часто слушаю фильм-оперу “Евгений Онегин” 1958 года (между прочим, дядя Кибкало - Евгений Кибкало, поет Онегина).
Посмотрел английский фильм “Онегин”. В восторге от Татьяны и сцены дуэли. В этом фильме, вспыхнувшая любовь Онегина может быть понята иначе, чем в романе, если присмотреться к лицу Онегина. Выбор актера подчеркивает, Онегин - демон. Не из любви он преследовал Татьяну, победы жаждал. 

В романе же об истинной любви Онегина свидетельствуют строки:
Но чтоб продлилась жизнь моя,
Я утром должен быть уверен,
Что с вами днем увижусь я

От этих Пушкинских слов, говорят, Маяковский умирал.
Того, что узнал о романе “Евгений Онегин” от В.Непомнящего, видимо, не узнал бы и не почувствовал бы ни у кого другого. Филолог-пушкинист Непомнящий горячо любит Пушкина. Наверное, также горячо, как Россию. Дело доходит до противопоставления России Европе с Америкой, думаю, слегка преувеличенного. У нас - Пасха, у них Рождество; у нас - культура, у них - цивилизация; у нас - тайна, у них - технология; у нас стрелялись за 10 шагов, у них - за 30; у нас честь - чистая совесть, у них - слава. 
Как еще одно противопоставление, В.Непомнящий объясняет эпиграф к главе 4 - "Нравственность в природе вещей": "мораль" не следует переводить как "нравственность", так как есть разница между "по совести" и "по правилам". Ю.Лотман указывает здесь на двусмысленность между нравственностью, как основой поведения, и проповедью нравственности. А И.Бродский вообще перевел по-своему - "Нравоучение в природе вещей". 
Эпиграф к главе 6, говорит В.Непомнящий, следует переводить как " Там, где дни облачны и кратки, Родится племя, которому жизнь не дорога" вместо публикуемого "... племя, которому умирать не больно".
Интересно рассуждение о том, что описанные взаимоотношения "мальчика и девочки" в романе по сравнению с актом продажи души в "Фаусте" могут показаться легким сюжетом. Но оказывается это не так. И роман, как периодическая таблица Менделеева, вместе с Онегиным обнаруживаются во всем написанном после него, вплоть до Твардовского. Добавлю от себя, что их не трудно обнаружить и у Бродского.
У В.Непомнящего мы находим и множество других тонких замечаний, следов любви и размышлений вслух. Вот еще прекрасные слова: Онегин говорит Татьяне, что любви нет, в то время, как сама любовь стоит перед ним. Так же, как Пилат спрашивает Иешуа, что есть истина, а она сама истина стоит перед ним. Или об убийстве Ленского: "несчастной жертвой Ленский пал". Как будто его не Онегин убил, а Ленский как-то сам пал. Кстати, онегинский ответ "Убит" в строке "Ну что ж?, убит" напомнил мне путинское "Она утонула".
Однако, многое остается непонятым для меня. Например, сон Татьяны. В молодости я не обращал внимание на сон из-за неприязни мистики и "полужуравлей". А оказывается этот эпизод - главный в романе. Объяснения же филолога, который распознает в криках тварей, увидевших Татьяну, - "Моё! Моё!" прямую угрозу России, мне не очень подходят. Может так и не пойму.
Читая про балы, мазурки, ножки, страсбургский пирог, бордо, ящик боевой и хандру, поневоле подумаешь, что появление революционного матроса неизбежно. 
Про пропущенные тексты в романе я узнал от пушкиниста Модеста Гофмана. А тот - со слов Пушкина. Вот они: "Пропущенные строфы подавали неоднократно повод к порицанию". Ниже - пример порицаемых и исключенных строф
Вот бы в какой-то сказке этот "усатый кот" отдельно появился, если уж дамам обидно.

В обычно не публикуемой главе о путешествии Онегина есть строки про Нижний Новгород, тоже наверное порицались:
Сюда жемчуг привез индеец,
Поддельны вины европеец,
Табун бракованных коней
Пригнал заводчик из степей,
Игрок привез свои колоды
И горсть услужливых костей,
Помещик - спелых дочерей,
А дочки - прошлогодни моды.
Всяк суетится, лжет за двух,
И всюду меркантильный дух.

Желаю вам захватывающего прочтения "Евгения Онегина" с Валентином Непомнящим.

Friday, May 04, 2012

"Wine is more drinkable"

Закончил 8-ми недельный стэнфордский курс NLP. Оказался сложнее, чем ML. Хоть и написано, что “вам понадобится 10 часов в неделю”, я и другие, судя по форуму, сидели над уроками дольше, особенно над шестым.
Видео лекции, документы по материалам - презентации и pdf, экзаменационные вопросы и упражнения. Программирование на Python или Java. Курс основан на книге “Speech and Language Processing” авторов Daniel Jurafsky (он же один из двоих лекторов) и James H. Martin. Очень активный форум с описаниями успехов, мольбами о помощи, предложениями по выполнению заданий, часто полезными и конструктивными - много толковых от российских студентов (не от меня). Вот, что было известно о численности аудитории к уроку 4-му: about 60,000 originally registered for the class; about 40,000 created course accounts, and by Week 4, about 6,000 are watching the videos and about 4,000 are submitting weekly assignments. Думаю, что после 6-го урока аудитория поредела.
Начали с основ обработки текстов, включая использование Регулярных Выражений. В списке для чтения к первому уроку получили ссылку интересного документа “Unix для поэтов”, где, например, приведена командная строка, вычисляющая частотное распределение слов в тексте. Узнал, как сравнивать слова, вычислять их похожесть по “расстоянию редактирования” (Min Edit Distance), трансформирующему одно слово в другое.
Второй урок (часто имею в виду упражнения к уроку) посвящен модели языка и проверке правильности написания слов (английских). Выяснил, что за многими утилитами, которые мы используем ежедневно, стоит огромная, законченная научная работа. Например, проверка правописания это не просто сравнение слов со словарем, но и поиск наиболее вероятных предложений по написанию, смыслу (используется модель языка) и даже произношению. Хорошее введение в тему - документ Питера Норвига “How to write a spelling corrector”.
В четвертом находили в тексте имена (людей), определяя их свойства для классификации текста: LOCATION, PERSON, ORGANIZATION. Свойства имен, например, такие: с заглавной буквы, отсутствие перед словами предлогов, наличие титулов/префиксов Mr, Mrs, Jr, van, der и других, наличие после имен “одушевленных” глаголов - сказал, написал, представил (биграммы).
Тема пятого урока - грамматика английского языка, разбор предложений на части речи. Программирование не потребовалось. Зато пришлось описывать множество вариантов построения предложений - грамматику. Например, самый общий вид повествовательного предложения представляется в форме S -> NP VP фраз существительного и глагола соответственно. Упрощенное описание построения английских предложений, полезное изучающим английский, можно найти здесь.
Наконец, самое трудоемкое упражнение 6 посвящено синтаксическому разбору предложения, основанному на вероятностном анализе структуры предложения. Нашел почти философское замечание - “наиболее часто встречающийся терм наименее информативен”. Сразу вспомнил Лотмановские слова: “перевод непереводимого оказывается носителем информации высокой ценности” и “В ситуации непересечения [языкового пространства говорящего и слушающего] общение предполагается невозможным, полное же пересечение делает общение бессмысленным”. Задача решалась примерно такая - к чему относится телескоп, то ли Джон с помощью телескопа увидел человека, то ли человек был с телескопом, “John saw a man with the telescope”. Решалась она поиском наиболее вероятного дерева структуры предложения на основе тренировок по базам текстов. CMU парсер предпочел вариант мужика с телескопом.
Из урока 7 стало ясно, насколько важно правильно сформулировать вопрос поисковику, и как ранжируются документы по адекватности запросу. Самый простой метод вычисляет Jaccard коэффициент |A and B| / |A or B|, где A и B - множество (set) слов в запросе и найденном докумунте. Методы применимы и для определения похожести документов, ведь запрос может рассматриваться/использоваться как документ, а документ, как запрос.
На уроке 8 мы были заняты распознованием используемых смыслов слов по контексту, например, слово bass в качестве существительного имеет 8 смыслов согласно WordNet, какой использовать? Что поисковику искать (категория) и как интерпретировать найденное? Если же мы знаем, то поймем, что “fool” - близкое по смыслу слово слову “clown”, а также, что “wine” is more drinkable than “it”, хотя “drink it” встречается чаще, чем “drink wine”.

Очень хороший курс: сбалансированное сочетание видео, текстов, вопросов, заданий на программирование, ссылки, форум, поджимающие сроки. Хотя “законченным” специалистом он меня не сделал, конечно. 
Online парсер предложений на русском языке и ссылки на ресурсы можно найти здесь.

Tuesday, June 28, 2011

"Расслоение" языка

Искал комментарии Лотмана и  наткнулся на тексты, посвященные юбилею Аквариума. Обращения написаны А.Троицким в разных стилях (скорее на разных языках) для разных слоев населения.
Рок-фанатам
Чуваки, чувихи! «Аквариум» едва ли не самая подкованная на предмет торчкового музона команда. В 72-м году они лабали по танцам Sabbath и прочий хардешник, но очень скоро Боря и Гаккель крепко подсели на Дилана и Т. Rex , а потом еще Харрисона и Лу Рида. Они много читали NME и Maker , поэтому в конце 70-х резко въехали в PISTOLS и заиграли что-то вроде панка. Но гораздо клевее у них покатил реггей. В конце 81-го в «Аквариум» пришли Курехин и Ляпин на лидере, и они заиграли полное электричество. А потом Боря спел, что рок-н-ролл мертв, и стал это доказывать на практике. У них вышло еще до фига альбомов, были классические песни все в основном в таком фолковом стиле типа Донована, Вэна Моррисона, Тома Петти... Короче, есть во что врубиться.
Интеллигенции
Друзья мои! В противоречивом мире рок-музыки не много отыщется исполнителей, творчество которых отмечено печатью высокого интеллекта. «Аквариум» одна из таких групп. Поэзия Бориса Гребенщикова яркое явление российской словесности. Как истинный художник, он никогда не шел на поводу у властей предержащих, не ставил свою музу на службу рыночному заказу. Как истинный интеллигент и гражданин, он не раз возвышал свой голос против кровопролития, духовного обнищания народа, коммунистического мракобесия и разбазаривания госказны. Выражаясь лапидарно, «Аквариум» в процессе креативной эволюции адекватно рефлексирует брожение русского пытливого менталитета конца XX столетия.
Новым русским
Дамы и господа! «Аквариум» один из самых успешных российских музыкальных проектов. Инициированный Б. Гребенщиковым в 1972 году, он первым из советских коллективов наладил (в 1980-м) регулярное производство и дистрибуцию аудиокатушек с записями своих песен. Карьера А. успешно продолжалась и в постсоветский период. В 1995 году был подписан контракт на эксклюзивный выпуск всей архивной продукции А. с фирмой «Триарий». Держатель авторских прав на песни А., Б. Гребенщиков может наряду с А. Макаревичем («Машина времени», «Смак», « Toshiba », фирма «Партия») претендовать на звание самого богатого человека из числа российских рок-исполнителей. Резюме: начав практически с нулевых инвестиций, «Аквариум» благодаря органичному менеджменту вырос в рентабельный музыкальный ансамбль.
Хиппи
Пипл! Ну разве есть у нас рокеры кайфовей «Аквариума»? Ну кого еще вы так любите за божественный стеб, за красоту, высоту и миролюбие? За мальчика Евграфа и Серебро Господа? Зажгите свечи и бал-дейте!
Иностранцам
Леди и джентльмены! В годы агонии коммунистического режима СССР не многие артисты осмеливались бросить вызов властям, и в числе этих отважных был «Аквариум». Свободолюбивые песни и нонконформистская позиция бэнда вызывали гонения со стороны КГБ. Противопоставляя себя тоталитарной системе, они выбирали низкооплачиваемые работы дворников и кочегаров, а свободное время посвящали музыке и альтернативному стилю жизни. Целое поколение иностранных студентов прошло через «Аквариум», оставив музыкантам и их подругам много джинсов, книг Толкиена, кассет и кисетов для марихуаны и увезя домой прекрасные воспоминания об этих русских. Песня «Этот поезд в огне», содержащая аллегорический образ Горбачева, утвердилась как один из гимнов перестройки. То cut a long story short : не поняв песни 212-8506, вам будет крайне трудно постичь загадку русской души.
Братве
Пацаны! (Далее см. раздел «Интеллигенции»). Теперь чисто без базара: крутые песни! Особенно эта «Долгая память хуже, чем сифилис». Или «Здесь может спать только тот, кто мертв»... Юноши и девушки! Вы живете активной жизнью, насыщенной новыми реалиями от «нинтендо» до «экстази», от роликов до презервативов. И песни «Аквариума» практически не имеют точек соприкосновения с вашей жизнью. Под них не потанцуешь, они навевают тоску и полны непонятных заморочек и ненужного пафоса. Сторож Сергеев просто деклассированный элемент, а сам Гребенщиков вылитый старик Козлодоев, тщащийся залезть к юной деве в постель со своим очередным компакт-диском. Мораль: разбирайтесь сами, парни и девчата. «Аквариум» полон рыбок: съел и порядок!
Митькам
Братушечки и сестренки! Кто гавкает? Дык Акваримушка же, елы-палы! Greatest Hits . Только ноженьки торчат... Положи его в воду, сестра. Тельничек потом высуши.
Журналистам
Коллеги! С Гребенщиковым и «Аквариумом» с самого начала все складывается легко. Они доступны, расположены к общению, словоохотливы. Грани облома начинают проступать позже: они отказываются говорить о собственных автомобилях (похоже, их нет), о сексе (возможно, и его нет), гонорарах (неужели и их?..) и не e состоянии прокомментировать высказывания Маши Распутиной, поскольку не знают, кто она такая. Далее по ходу дела выясняется, что собеседник эрудированнее вас и обладает более богатым словарным запасом. В довершение всего он не только не желает оплачивать интервью, но и требует, чтобы его угостили водкой.

Впечатляет остроумие и владение языками. Захотел написать что-то аналогичное для программистов, типа: “Дорогой программер. Вероятно (95%), ты трэкаешь исполнительскую активность группы. Если да, то знаешь, у них нет ни одной висячей ссылки, ни дефолта, ни умолчаний. Иначе - “// никогда здесь не окажешься”. Так вот, они тестируют новый релиз …”
Затем вспомнил, что среди программистов есть и интеллигенты, не скажущие “клава”, и братва, крякающая модное приложение. Тогда делать нечего. Сообщение доставлено.

Sunday, February 13, 2011

Поломки истории

От приятеля (его нет на картинке), вернувшегося из Вьетнама, для себя дремучего я вдруг узнал, что там используют латиницу. Отказ от письменности и вместе с ней от истории казался невозможным государственным актом. Почитал статьи, действительно, Вьетнам из всех стран, использующих иероглифы и решившихся на реформы, поступил самым радикальным образом - отказался от иероглифики, даже в школе не преподается. Официально это произошло в 1910 (некоторые пишут - в 1918) году. 
Новую вьетнамскую письменность на основе латиницы разработал представитель французской иезуитской миссии Александр де Род (1591-1660). Вот как выглядел тот иезуит
Французская колониальная администрация продвигала реформу. В результате, утрачена  древняя вьетнамская письменность тьыном, основанная на китайской иероглифике, которая формировалась в период с X по начало XX века. Профессор Нго Тхань Нян, вице-президент Американского общества по сохранению письменности тьыном, говорит: «Сейчас во всем мире можно насчитать лишь около ста человек, которые могут хорошо читать и писать на тьыном, в то время как более 90% материалов на тьыном еще не переведено на современный вьетнамский язык». Вот еще одно свидетельство утраты: “Нам известно по названиям большое количество сочинений вьетнамских монахов X-XIII вв., но ни одного из них не сохранилось.”
Хорошо, что работы по восстановлению текстов и знаний начаты и ведутся. Но даже А.Т.Фоменко не удастся реставрация, если нет исторических  материалов.
Не мне судить о потерях, но утрата письменности должна быть не восполнима. Ю.М.Лотман пишет: “Можно сказать, что история - один из побочных результатов возникновения письменности.” Были и другие идеи о письменности и ее значении. Например, у Платона в произведении “Федр” читаем: “В души научившихся им [письменам] они вселят забывчивость, так как будет лишена упражнения память: припоминать станут извне, доверяясь письму, по посторонним знакам, а не изнутри, сами собою. Стало быть, ты нашел средство не для памяти, а для припоминания. Ты даешь ученикам мнимую, а не истинную мудрость. Они у тебя будут многое знать понаслышке, без обучения, и будут казаться многознающими, оставаясь в большинстве невеждами, людьми трудными для общения; они станут мнимомудрыми вместо мудрых".
Вообще, как оценить, что изменилось бы, если бы не сохранились шумерские сказания о Гильгамеше, сложенные (клинопись) еще в III тысячелетии до н. э., или “Слово о полку Игореве” XII век н.э ? Или сохранилось бы то, что утрачено, и о чем мы не знаем. Или, что было бы иначе, не прочти я Гоголя и Достоевского? Или, что если прочитал бы только их? Что является значимым фактором для хода истории? Насколько чувствительна она к происходящим событиям, и чувствительна ли? Что могло и повернуло ее уже, и когда (одно из ветвлений истории - 1917)?
Вернемся к латинице. Надеюсь, наши сегодняшние реформаторы народного образования не станут предлагать переход на латиницу. Точнее - предлагать вернуться к латинице, так как согласно черноризцу Храбру, славяне, будучи язычниками, не имели своей письменности и пытались записывать речь латиницей: “Ведь прежде славяне, когда были язычниками, не имели письмен, но [читали) и гадали с помощью черт и резов. Когда же крестились, то пытались записывать славянскую речь римскими и греческими письменами, без порядка”.
Ниже - кириллица, рожденная в первом тысячелетии нашей эры. На всякий случай, сохранить, вдруг будут переходить на латиницу
Ссылки:

Saturday, October 23, 2010

Powerless PowerPoint

Нет лучшего инструмента в обучении, чем традиционная черная доска. Она настолько ценный инструмент, что некоторые учителя предпочитают носить ее с собой.

На фотографии - учителя в поисках учеников в горах Курдистана, каждый со своей доской (blackboard) и мелком в кармане.
Уже обсуждалось, насколько важно выступающему с докладом или презентацией использовать доску, флипчарт или сенсорный экран, для того, чтобы, рисуя на ходу диаграммы или упрощенные картинки, иллюстрировать свой материал, убеждать аудиторию и отвечать на вопросы.
Оказывается, рисование на доске во время выступления важно не только с точки зрения рисунка. Не менее важны жесты, которые вы совершаете, рисуя во время выступления. Жестам и позам посвящаются специальные разделы тренингов, обучающих менеджеров и ведущих инженеров искусству выступать публично. Но не канцлеров. Вспомните, как иногда складывает руки госпожа Меркель, примерно так, но ниже пояса,

и станет ясно, как легко мы можем разрушить впечатление о себе, а заодно и о своих заявлениях.
Так вот, рисуя и двигая руками синхронно с речью, а иногда и с рождением мысли, вы даете слушателям дополнительную информацию о материале, который вы докладываете. Рисуя мелком на доске, вы двигаете всем телом; рисуя фломастером на бумаге, вы двигаете кистью. Вовлеченное в визуализацию все тело сигнализирует аудитории больше информации, чем движущаяся кисть. Вот почему опытные преподаватели предпочитают традиционные черные доски с мелком вместо флипчартов с фломастером.


Дальше самое интересное. Как пишет Rafael Nunez в “Do Real Numbers Really Move? Language, Thought, and Gesture: The Embodied Cognitive Foundations of Mathematics”, жесты преподавателя физики или математики восполняют формальные описания (формулы) недостающей информацией. Она не упущена, просто нет средств для ее выражения. Например, предел бесконечного ряда в книге R.Courant & H.Robbins “What is Mathematics?” описывается так: “We describe the behavior of Sn by saying that the sum Sn approaches the limit 1 as n tends to infinity, and by writing
1=1/2+1/2^2+1/2^3+1/2^4+...”
Комментируя приведенное выражение, Rafael Nunez пишет: “если взглянуть на выражение внимательно, то можно увидеть, что оно описывает несколько фактов, касающихся чисел и результата дискретных операций над числами, но нет ничего о понятии движения. Нет ничего, что описывало бы approaching и tending”. Думаю, добавление знака суммы и стрелки устремления n (которое отсутствует в выражении) к бесконечности улучшает ситуацию. В статье дается еще несколько примеров, а затем показывается, что именно жест выступающего играет определяющую роль, добавляя “движение”, внося информацию  об изменениях и “стремлениях”. Так, профессор математики на фотографиях ниже говорит об осцилляции значений последовательности с помощью горизонтального движения правой руки.

Сам я обучался безжестовой “культуре” речи, хотя, и не очень успешно. Учительница по литературе многократно говорила нам - “Не размахивайте руками, когда говорите, это некультурно”, о чем я простодушно заявлял на первых порах лекторам, обучающим нас искусству презентаций.
Конечно, размахивая руками, можно разбить стакан, вытеснить смысл сообщения эмоциями, то есть, потерять внимание аудитории и лишиться понимания ею материала. Но то - крайний случай.

Monday, August 30, 2010

Ограничивает ли язык ваше мышление?

The NY Times опубликовал статью “Определяет ли ваш язык то, как вы думаете”, в оригинале - “Does Your Language Shape How You Think?”. 70 лет назад в одном из научных журналов Б.Уорфом утверждалось Да, если нет в вашем языке слова об явлении, вы не можете это явление мыслить и понять. Автор современной статьи G.Deutscher призывает признать то утверждение ошибкой и объясняет почему. В частности, не может быть истиной то, что, если в языке нет будущего времени, то носитель языка не может понять представление других наций (имеющих и пользующихся future tense) о будущем времени.
Думаю, прав и тот, смеющий утверждать об ограничении мышления языком, и другой, отвергающий такое ограничение. Понятно, что, имея ограниченный словарь, вы можете достаточно далеко пойти в конструкции понятий, вплоть до расширения словаря. Должно быть ясно также, что проблема Эллочки Людоедочки и ее 17-словного словаря существует. И по этой причине мы шагнули от С к С++, развивая наши выразительные средства. Но, по-прежнему, есть много программистов, которые утверждают, что они могут написать все, что “вы пишете на С++”, на С (и даже на ассемблере). Язык определяет уровень задач, которые вы решаете; сложность проблем, которые вы пытаетесь запрограммировать, определяет язык, на котором вы пишете. Не помню дословно и кто, кажется Дюма, сказал: “На французском - с женщиной, на немецком - с лошадью, ...”
Может быть не кстати, популярность языков представлена на следующей картинке из сообщения Уадлера