Выпускная работа па " Асновах інфармацыйных тэхналогій"




Дата канвертавання30.03.2016
Памер280.68 Kb.


БЕЛАРУСКІ ДЗЯРЖАЎНЫ УНІВЕРСІТЭТ

Выпускная работа па

Асновах інфармацыйных тэхналогій”



Магістрантка

кафедры гісторыі беларускай мовы

Навіцкая Людміла Міхайлаўна

Кіраўнікі:

к.ф.н., дацэнт Ціванова Галіна Кузьмінічна,

асістэнт Пазнякоў Андрэй Міхайлавіч

Мінск – 2009

Змест


Змест 2

Спіс пазнак да ўсёй работы 3

Рэферат па тэме: “Тэксталагічны і гістарыяграфічны аналіз ва ўмовах развіцця інфармацыйных тэхналогій” 4

Уводзіны 4

Глава1. Агляд літаратуры 5

Глава 2. ІТ і тэксталогія: граматычны аспект 6

Глава 3. Гістарыяграфія –ІТ – дыялекталогія: лінгвагеаграфічная сістэма ”Дыялект” 13

Заключэнне 16

Бібліяграфічны спіс 17

Прадметны паказальнік да рэферата 18

Інтэрнэт-рэсурсы ў прадметнай вобласці 19

Персанальны сайт 21

Граф навуковых інтарэсаў 22

Прэзентацыя магістарскай дысертацыі 23

Бібліяграфічны спіс да выпускной работы 25



Спіс пазнак да ўсёй работы


ІТ – інфармацыйныя тэхналогіі.

БД – база дадзеных.

Лема – кананічная форма лексемы (формы бегаў, бегала, бягу, бяжыш, будуць бегаць, бегучы маюць адну і тую ж лему – бегчы).

Лематызатар – праграма, якая дазваляе суадносіць канкрэтныя словаўжыванні з лемай.

Канкарданс – алфавітны словаўказальнік да пэўнага тэксту з указаннем значэнняў слоў і ўсіх выпадкаў іх ужывання ў дадзеным тэксце.

Рэферат па тэме: “Тэксталагічны і гістарыяграфічны аналіз ва ўмовах развіцця інфармацыйных тэхналогій”

Уводзіны


Філалогія і інфарматыка. Гэтыя тэрміны патрабуюць вызначэння і канкрэтызацыі: што маецца на ўвазе пад глыбокім паняццем філалогія і аб’ёмным паняццем інфармацыйныя тэхналогіі? Полісемантычнасць тэрміна філалогія абумоўлена развіццём і гістарычнымі зменамі. У дадзенай працы найбольш рацыянальнай становіцца дэфініцыя М. Шапіра «Галоўны прадмет філалогіі – тэкст і яго сэнс, толькі філалогію цікавіць тэкст як цэлае, то бок унікальнае, непаўторнае адзінства сэнсу ва ўсёй паўнаце і ў любых тонкасцях яго матэрыяльнага выяўлення ў пачуццёва ўспрымаемай форме” [11, с.57].

Калі ўяўленне пра сутнасць філалогіі змянялася з цягам часу, то неадназначнасць паняцця інфармацыйныя тэхналогіі, наадварот, абумоўлена яго навізною (час з’яўлення – канец ХХ ст.). Гэтым тэрмінам абазначаюць як працэсы перапрацоўкі інфармацыі, так і працэсы стварэння пэўнага інфармацыйнага прадукта. На ІІ Міжнародным кангрэсе ЮНЕСКА “Адукацыя і інфарматыка” да інфармацыйных былі аднесены тэхналогіі увода/вывада, збору, захавання, перадачы і апрацоўкі дадзеных, падрыхтоўкі тэкставых і графічных дакументаў, абароны інфармацыі, праграмавання, мадэлявання, дыягностыкі, кіравання аб’ектамі, працэсамі, сістэмамі [5]. Такая інтэрпрэтацыя закладзена і ў аснове дадзенай працы.

На мяжы стагоддзяў у грамадскім жыцці адбыліся змены, звязаныя з фарміраваннем новага тыпу грамадскага ладу (інфармацыйнага) Створаныя ў пасляваенны час новыя навуковыя і тэхнічныя метады і сродкі кібернетыкі, а потым і інфарматыкі значна змянілі агульначалавечую карціну свету. У ХХІ ст. не столькі аб’емы прамысловасці, колькі інфармацыйныя магчымасці з’яўляюцца паказальнікамі эканамічнай развітасці таго ці іншага грамадства. Інфармацыя, пазнанне выходзяць на першае месца ў аксіялагічнай сістэме – яны разглядаюцца як набытак сучаснага соцыуму. Таму інфарматызацыя як асноўны шлях да інфармацыйнага грамадства становіцца сёння прадметам даследавання шырокага кола спецыялістаў: ад прыродазнаўцаў да гуманітарыяў.

Сучаснае інфармацыйнае грамадства дваіста разумее ролю ІТ. Інфарматызацыя сёння – гэта само развіццё інфармацыі, паглыбленне інфармацыйных сувязей, пашырэнне разумення інфарматыкі як міждысцыплінарнай навукі, прадметам якой з’яўляецца найперш уплыў інфармацыйных працэсаў на соцыум. Актуальным застаецца і разуменне інфарматызацыі як увядзення тэхналагічных прыёмаў ў прадметную вобласць прыродазнаўчых і гуманітарных навук., яе інструментальны аспект.

Такім чынам, філасофія жыцця прадугледжвае, не далейшую дыферэнцыяцыю, дыверсіфікацыю разнастайных спосабаў пазнання свету, а іх інтэграцыю, заснаваную на выкарыстанні найноўшых тэхнічных сродкаў і інфармацыйных тэхналогій. Доказам таму стала з’яўленне ў канцы ХХ ст. “прыватных” інфарматык – сацыялагічнай, гістарычнай, лінгвістычнай і г.д.

У сусветнай лінгвістыцы ўжо вызначыліся асноўныя кірункі ў разглядзе графічных, лексічных і тэкставых характарыстык камп’ютэрнага дыскурсу, у даследаванні камп’ютарнага жаргону, у аналізе лінгвістычнай канцэпцыі гіпертэксту, распрацоўваецца праблема жанравай аднесенасці і структуры жанраў Інтэрнэт-камунікацыі, з’явіліся новыя паняцці канцэптуальная інфарматыка, машынная лінгвістыка, ствараюцца праграмы праверкі правапісу (ORPHO 9.0), марфалагічныя аналізатары і інш.

У канцы ХХ – пачатку ХХІ стагоддзя, калі ІТ увайшлі ў навуковы ўжытак, быў здзейснены сапраўдны прарыў у гістарыяграфіі і тэксталогіі. Раней дадзеныя апрацоўваліся “ўручную”, і ў выніку атрыманыя рэзультаты валодалі вялікай ступенню хібнасці. Да прыкладу, сродкамі стандартнага набору шрыфтоў MS Office (Times New Roman, Courier і інш.) немагчыма было адлюстраваць сэнсавызначальныя для царкоўнаславянскай мовы дыякрытыкі (цітла &, камору 6 і інш.), вынасныя літары ( = , >, D), лігатуры (t) і, нарэшце, тыповыя царкоўнаславянскія літары э, я, >, ¤ і інш. З ўвядзеннем ва ўжытак старажытных шрыфтоў тыпу Izhitsa, Blagovest, Irmolagion, Triodion, Putiata, Menanion, etc. у даследчыкаў з’явілася магчымасць захоўваць тэксты ў адэкватным электронным выглядзе, што значна аблегчыла моўны аналіз помнікаў старога пісьменства. Да таго ж, электронны фармат дазволіў аўтаматызаваць шэраг статыстычных падлікаў, сэканоміўшы тым самым час і сілы даследчыкаў. Калі непасрэдным, механічным, падлікам займаецца камп’ютар, у мовазнаўцы з’яўляецца нашмат больш часу для навуковай апрацоўкі інфармацыі.

Прадметам дадзенага даследавання з’яўляюцца камп’ютарызаваныя спосабы адлюстравання і аўтаматызаваныя прыёмы аналізу старажытных тэкстаў. Мэта даследчай працы – выявіць ступень інтэграцыі камп’ютарных і інтэрнет-тэхналогій ў філалагічную сферу старажытнай граматыкі.


Глава1. Агляд літаратуры


Пашырэнне інфармацыйнай прасторы спрычыніла хуткае развіццё прыкладной інфарматыкі, заснаванай на ўвядзенні ў сферу прадметнай вобласці (гістарычнай граматыкі ці лексікалогіі) інструментальных характарыстык, неабходных для апрацоўкі зместу. Тым не менш, сітуацыя ўсеагульнай інфарматызацыі патрабавала перагляду саміх базісаў філалагічных навук. Інфармацыйныя тэхналогіі, акрамя прыкладных уласцівасцяў, займелі яшчэ і змястоўныя характарыстыкі – яны сталі прадметам даследавання сацыялогіі, гісторыі, філасофіі і,канечне, філалогіі.

Філолагі ці не першыя пачалі выкарыстоўваць у сваёй працы ІТ: дастаткова ўспомніць практыку засваення методыкі машыннага перакладу, стварэння электронных корпусаў слоўнікаў і даведнікаў(у беларускім мовазнаўстве – Белазар – беларуска-руска-беларускі перакладны слоўнік).

На сённяшнім этапе адбываецца развіццё корпуснай лінгвістыкі, якая пачынае актыўна выкарыстоўваць ІТ пры апрацоўцы вялікіх корпусаў тэкстаў. На мяжы стагоддзяў ўзнікае новы вектар развіцця філалогіі – інтэрнэт-лінгвістыка, пра што сведчыць параўнальна вялікая колькасць публікацый у дадзеным рэчышчы (манаграфія С. Кузняцова “Ощупывая слона: Заметки по истории русского Интернета”, Г. Трафімавай “Языковой вкус интернет-эпохи в России: Функционирование русского языка в Интернете”, артыкулы Г. Гусейнава, Э. Азімава, А. Літнеўскай, М. Сідаравай, украінскай даследчыцы А. Гарошкі і г. д.). У Расіі абаронены шэраг кандыдацкіх дысертацый па Інтэрнэт-лінгвістыцы (А. Аўрамавай, Н. Асмус, В. Дзедавай і інш.), найактуальнейшая гэта тэма для беларускіх даследчыкаў. На жаль, даследуецца найперш руская мова ў Інтэрнэце (артыкулы Н. Мячкоўскай, Т. Рамзы і А. Доўгаль). Датычна Інтэрнэт-камунікацыі па-беларуску ёсць толькі адзінкавыя публікацыі ў гэтым кірунку С. Важніка, А. Рудэнкі, І. Соўпеля, С. Шупы, А.Лянкевіч, даведачнае выданне “Тры стыхіі Байнэта” С. Важніка (з серыі “Лекцыі па Інтэрнэт-лінгвістыцы”), зборнік “Беларуская мова. Інтэрнэт і камп’ютэр”, выдадзены па выніках міжнароднага сімпозіума “Разнастайнасць моў і культур у кантэксце глабалізацыі”, які праводзіўся ў Мінску ў 2002 годзе, а таксама Інтэрнэт-публікацыі У. Каткоўскага .

У прасторах рунета шырока прадстаўлены даследаванні па інтэграцыі інфармацыйны і прыватнанавуковых тэхналогій у сферы крыніцазнаўства (Ю.Ліхтэр “Археологический источник и база данных. Выбор модели”), педагогікі (канферэнцыі “Педагагічныя асновы гістарычнай інфарматыкі”, Мінск, 2001, 2003), дыялекталогіі (артыкулы Е. Жданавай), увогуле гуманітарных навук (І. Алешын “Гуманитарная информатика: аспекты проблем”, К. Колін, О. Казлоў).

На сайце http://www.irmologion.ru актыўна вядзецца распрацоўка шрыфтоў, аналізуюцца метады рэалізацыі царкоўнаславянскага фонта у камп’ютарных сістэмах.

Праблематыка гістарычнай інфарматыкі ў яе лінгвістычным аспекце шырока прадстаўлена ў працах І. Маргуліса (праект “Гиперазбука”), В. Баранава (сістэма “Манускрыпт”), А. Воцінцава, Р. Гнуцікава, С.Нікіфаравай, беларускіх даследчыкаў А. Балыкінай, А. Оськіна, В.Сідарцова, амерыканца Р. Клемінсана (прапановы па ўдасканаленню сістэмы Unicode 8 у артыкуле Unicode for slavists or how to slice a pineapple).


Глава 2. ІТ і тэксталогія: граматычны аспект


Гістарычная тэксталогія і марфалогія з’яўляецца адным з тых кірункаў у сучаснай навуковай парадыгме, якія найбольш зацікаўленыя у выкарыстанні ІТ, паколькі навукоўцы пры аналізе дадзеных маюць справу з вялікай колькасцю нестандартнай інфармацыі (рукапісныя тэксты уставам, паўуставам, скорапісам), апрацоўваць якую звычайнымі сродкамі дастаткова складана і працаёмка.

З пашырэннем інфармацыйнай прасторы ў гістарычным мовазнаўстве вызначыўся падыход да вырашэння праблем адлюстраванння і апрацоўкі старажытных тэкстаў. У навуковым дыскурсе з’явілася новае паняцце – электронная публікацыя, якая мела шэраг вызначальных характарыстык:



  • магчымасць хуткага пошуку адпаведнай інфармацыі па графічных, арфаграфічных, структурных, граматычных крытэрыях;

  • мажлівасць падачы ў папяровым фармаце не толькі самога зместу, але і даведачнага матэрыялу;

  • варыянт неабмежаванага тыражавання (пашырэння ў масы).

Электронная публікацыя мела за мэту вырашэнне дагэтуль невырашаных задач:

  • адэкватнасць арыгіналу – захаванне ўсіх графіка-арфаграфічных і структурных асаблівасцяў помніка: варыянтных і вынасных літар, цітлаў і іншых дыякрытыкаў, знакаў афармлення тэксту, ініцыялаў і малюнкаў,а таксама фіксацыі структуравання тэксту на полі, перадача адрозненняў у почырках і г.д.;

  • трансфармаванасць – магчымасць змяненння графічнага выгляду тэксту ў бок яго спрашчэння: занясенне ў радок вынасных знакаў, раскрыццё ціталаў, аўтаматычная замена графічных дублетаў; магчымасць верыфікацыі структуры тэксту: разбіўка тэксту на сэнсава значымыя часткі, ілюстрацыя тэксту па радках і ў сэнсавай паслядоўнасці;

  • інфарматыўнасць – наяўнасць даведачнага апарата: паказальнік тыпаў форм, магчымасць выбаркі форм па крытэрыях;

  • даступнасць – магчымасць лёгкага атрымання арыгіналу тэксту.

Менавіта ў гэтай інтэнцыі на пачатку ХХІ ст. ва Удмурцкім і Іжэўскім дзяржаўных універсітэтах (РФ) была распрацавана спецыяльная методыка даследавання старажытных тэкстаў – сістэма “Манускрыпт”.

Сёння на партале http://www.manuscripts.ru/ знаходзіцца ў доступе некалькі калецый старажытных помнікаў:



  • рукапісы, створаныя на Русі ў ХІ ст. Гэта транскрыпцыі 20 рукапісаў і спісы поўных твораў ад 100 і больш за 300 лістоў у аб’ёме. Набор, праверка і рэдагаванне калекцыі праводзіліся супрацоўнікамі, арспірантамі і студэнтамі Удмурцкага і Іжэўскага дзяржаўных універсітэтаў РФ на працягу 16 год (1991-2006).

  • калекцыі старажытных рускіх спісаў Евангелляў, службовых міней, трыодый, тры спісы Аповесці мінулых гадоў, некалькі твораў патрыстыкі.

  • пачатковыя тэксты са збору М. Ламаносава.

Пад час апрацоўкі гэтых электронных сярэднявечных выданняў былі вынайдзены і мадэрнізаваны модулі ўводу і рэдагавання тэкстаў, арганізавана магчымасць падрыхтоўкі тэкстаў і даведак да публікацый, адным словам, створаныя лінгвістычныя рэсурсы, якія дазволілі атрымліваць інфармацыю для вырашэння разнастайных задач ў галіне гістарычнага мовазнаўства і роднасных дысцыплін.

Даследчая сістэма “Манускрыпт” мае шэраг магчымасцяў, якія якасна вылучаюць яе сярод іншых даследчых сістэм (акрамя таго, што “Манускрыпт” – першая спроба камп’ютарызаваць аналіз старажытных тэкстаў):



  • захаванне тэксту ў БД, мінімальнай адзінкай якой з’яўляецца сімвал;

  • стварэнне любых фармальна выяўленых у рукапісах адзінак як сукупнасці сузалежных сімвалаў;

  • аб’екты БД маюць уласцівасці і значэнні, адпаведныя тэкставым аналагам;

  • стварэнне web-модуляў, якія забяспечваюць магчымасць дыстанцыйнай работы з сістэмай;

  • стварэнне web-сервісаў, якія дазволяць карыстальніку фарміраваць запыт па некалькіх крытэрыях;

  • наяўнасць лінгвістычных рэсурсаў, якія дазваляюць карыстальніку падрыхтаваць і апублікаваць яго на партале http://www.manuscripts.ru/

  • наяўнасць інструментаў для мета- і аналітычнага апісання тэкстаў і рукапісаў;

  • магчымасць пошуку тэкставых прэцэдэнтаў і аўтаматычнага прывядзення іх да лемы і інш.

Пералічаныя характарыстыкі сістэмы забяспечваюцца тэхналагічным апаратам “Манускрыпта” – спецыялізаванымі модулямі:

    1. рэдактар OldEd, з дапамогай якога праводзіцца набор і рэдагаванне тэксту, увядзенне значэнняў адзінак і фіксацыя сувязей між імі, лематызацыя словаформаў і інш. Тэхналагічная база рэдактара дазваляе на дадзеным этапе стварыць архетып (у гістарычнай граматыцы прынятая назва – пратограф) тэксту, лінгвістычныя і структурныя адзінкі якога могуць быць звязаны ў БД з адпаведнымі адзінкамі ў рукапісах. Рэдактар валодае шырокім спектрам даступных функцый:

  • фіксацыя сувязі між адзінкамі тэкстаў, рукапісаў, фрагментаў і адпаведнымі адзінкамі слоўніка і даведніка,

  • аўтаматызаваная лематызацыя слоў з дапамогай граматычнага слоўніка старажытнарускай мовы;

  • рэдагаванне шэрагу выбарак і іх адзінак, а таксама сродкаў аб’яднання тэкстаў у калекцыі, што дазваляе самім аўтарам выданняў фарміраваць і публікаваць на партале калекцыі.

    1. web-модуль увядзення і рэдагавання ўласцівасцяў і значэнняў адзінак БД, які забяспечвае стварэнне і відазмяненне даведнікаў для разбору тэкстаў, адзінак.

Варта адзначыць, што модуль выбарак патрабуе ад карыстальніка выканання пэўных тэхнічных умоў (браўзер Internet explorer 6.0 і вышэй, усталяванне Oracle AS Form Services). Акрамя таго, уваход у сістэму патрабуе абавязковай аўтарызацыі.

Так, абраны модуль прадугледжвае выкананне складаных запытаў на аснове тэксталагічных, лінгвістычных, слоўнікавых і іншых адзінак БД “Манускрыпт”. З гэтай мэтай былі створаны іерархіі (Малюнак 2.1):



      • геаметрычная G – падзел на рукапіс/ліст/старонку/словаформу/знак;

      • лінгвістычная – можа быць марфалігічная MOR (падзел на сінтагмы) і сінтаксічная SYN (вылучэнне сказаў, дзеепрыметных зваротаў і г.д.);

      • функцыянальна-структурная FS – падзел на структурныя адзінкі згодна з іх функцыямі (тэкст/раздзел/верш/знак);

      • па аўтарах AU – падзел на фрагменты згодна з аўтарскай прыналежнасцю

      • па часе прачытання – можа быць рухомай (RFC) і нерухомай (RMC).

Малюнак 2.1 
Наступным крокам афармлення выбаркі становіцца канкрэтызацыя умоў вычлянення (Малюнак 2.2): разбіўка па часцінах мовы, па зменлівасці/нязменнасці, па ліках, па родах (больш за 30 крытэрыяў).

Малюнак 2.2 

На жаль на дадзеным этапе магчымасці шараговага карыстальніка строга абмяжоўваюцца – праграма не дазваляе ўбачыць выбарку з-за абмежаванага доступу. Гэткая сітуацыя можа тлумачыцца тым, што сама сістэма “Манускрыпт” знаходзіцца ў стадыі распрацоўкі, а такога кшталту запыт спрычыньвае значную нагрузку на сервер.



    1. web-модулі граматычных слоўнікаў і марфалагічнага аналізу, з дапамогай якіх праводзіцца лематызацыя.

Для пошуку тэкставых прэцэдэнтаў у калекцыях і для вывядзення рэзультатаў запыту ў выглядзе пераліку пачатковых формаў створана некалькі версій марфалагічнага аналізатара старажытнарускай мовы (сумесна з супрацоўнікамі Інстытута рускай мовы імя В. В. Вінаградава РАН, кіраўнік – А. А. Піхчадзэ). Мадэль электроннага слоўніка і правілы лематызацыі дазваляюць ажыццявіць прывядзенне да пачатковай формы адпаведных масцы тэкставых прэцэдэнтаў незалежна ад ступені іх графіка-арфаграфічнай варыяцыі. Шырокі спектр магчымасцяў прад’яўлення вынікаў дазваляе выявіць наяўнасць / адсутнасць адзінак, іх колькасць і перайсці да адпаведных кантэкстаў.

Супрацоўнікамі партала “Манускрыпт” было распрацавана некалькі версій марфалагічнага аналізатара. Версія №2 дазваляе суаднесці пэўнае ўжыванне з канкрэтнага тэксту са словаформай слоўніка старажытнарускай мовы ці слоўніка стараславянскай мовы. У трэцяй версіі марфалагічнага аналізатара ўводзіцца магчымасць разбору ўведзенага радка на пачатковыя формы (Малюнак 2.3).



Малюнак 2.3 
Найбольшымі магчымасцямі валодае версія №5 марфалагічнага аналізатара, які ўяўляе сабой электронны лематызатар. Яго модуль дазваляе: канкрэтызаваць аб’ем пошуку (Калекцыя старажытнарускіх жыцій, “Житие Александра Невского”); вызначыць крытэрый пошуку: задаць узор (канкрэтная словаформа, пачатковая форма) ці вызначыць граматычную прымету (часціна мовы, род, лік і г.д.); абраць параметры адлюстравання вынікаў (асобнае акно, парадыгма, слоўнікавы артыкул). З дапамогай такога марфалагічнага аналізатара вельмі лёгка праводзіць статыстычныя падлікі ўжытых словаформ. Так, у абраным “Житии Александра Невского сустракаецца 1150 назоўнікаў, з іх 521 маюць некалькі лем, 94 – адну лему (Малюнак 2.4). Пры жаданні кожную словаформу можна візуалізаваць у кантэксце, націснуўшы спасылку “Результаты”.
Малюнак 2.4 

    1. web-модуль пошуку тэкстаў, рукапісаў і іх фрагментаў, які забяспечвае фарміраванне запыту на базе мета і аналітычных характарыстык;

    2. web-форма запыту і вывядзення рэзультатаў выбаркі па некалькіх тэкстах, рукапісах, фрагментах у выглядзе параўнальных шэрагаў іх адзінак.

Першы модуль быў рэалізаваны ў двух варыянтах у выглядзе запытальных формаў для простага і пашыранага пошуку. Просты пошук адбываецца праз маску патрэбнага значэння метахарактарыстык тэкстаў і рукапісаў, а таксама аналітычных апісанняў іх фрагментаў. Пашыраны пошук дае магчымасці сфармуляваць запыт па шэрагу параметраў – разнастайных уласцівасцяў і значэнняў рукапісаў, фрагментаў (выкарыстоўваюцца лагічныя функцыі ЦІ, І).

Да прыкладу, з усёй калекцыі рукапісаў было выбрана “Жыціе Фёклы” і па запыце адабраны тэкставыя фрагменты з ліста 1, якія мелі словаформу она (Малюнак 2.5)


Малюнак 2.5 

    1. web-модуль запытаў і выбарак з улікам усіх параметраў БД, якія забяспечвае правядзенне разнастайных аперацый з выбаркамі.

З мэтай апрабацыі вышэй апісанай сістэмы аўтар рэферата была зарэгістравана на партале www.manuscripts.ru “Манускрыпт” і шляхам падпісання “Пагаднення карыстальніка” атрымала доступ да калекцыі старажытнарускіх жыцій – у прыватнасці, да “Жыція Аляксандра Неўскага” спіса канца XV ст. Выбар узора даследавання быў абумоўлены спецыфікай спецыялізацыі аўтара, якая актыўна даследуе пласт рукапіснай жыційнай літаратуры XIV-XVII стст. (у прыватнасці “Жыціе Феадоры Александрыйскай” Сінад.№752 і RKF-82, “Жыціе Аляксея, чалавека божага” Паг.№869 і інш.)

З дапамогай модуля запытаў быў сфармуляваны запыт: на лістах 1-10 арыгінальнага (неатфарматаванага) тэксту знайсці ўсе займенныя словаформы его. Такіх формаў аказалася ў жыціі 12. Паколькі старонка выведзеных вынікаў з’яўляецца дынамічнай, найбольш прыдатным спосабам ілюстравання стаў Малюнак 2.6.



Малюнак 2.6 

Адной з пераваг праграмы з’яўляецца тое, што атрыманыя рэзультаты можна вывесці не толькі праз указанне старонак і радку (неабходных ў навуковых даследаванннях), а таксама праз колькасны ўказальнік (падлічвае колькасць ужыванняў) і праз візуалізацыю кантэксту (Малюнак 2.7).


Малюнак 2.7 

Глава 3. Гістарыяграфія –ІТ – дыялекталогія: лінгвагеаграфічная сістэма ”Дыялект”


Пры даследаванні гісторыі паходжання, бытавання таго ці іншага рукапіснага старажытнага помніка прыдатным з’яўляецца дыялекталагічны метад, які прадугледжвае картаграфаванне асобных дыялектных адметнасцяў, а затым фарміраванне цэласнага ўяўлення пра лінгвістычны ландшафт пэўнай тэрыторыі на аснове дадзеных асобных лінгвістычных карт. Дыялекталогія як навука мае вельмі цесныя сувязі з гістарычнай марфалогіяй і тэксталогіяй, паколькі менавіта ў дылекталагічным пласце захавалася найбольш старажытных формаў. Такім чынам, моўная адметнасць помніка з’яўляецца адным з крытэрыяў вызначэння месца стварэння тэксту ці паходжання перапісчыка. Так, да прыкладу, моўны аналіз “Жыція Феадоры Александрыйскай” Сінад. №752 пацвердзіў гістарычныя дадзеныя аб старабеларускім паходжанні зборнікаў. Беларускімі маркёрамі ў тэксце ЖФА рукапіснага зборніка Сінад. №752 з’яўляюцца:

  • тэндэнцыя да ўжывання паерыка замест ераў пры абазначэнні папярэдняга цвёрдага ці мяккага гукаў: лSВовы,uмерSлую, творSче і інш.;

  • наяўнасць адной графемы " для перадачы гукаў [‘a], [ja] незалежна ад пазіцыі ў слове: вседеРжител", дит"ти, ра", "ко і інш.;

  • перадача фанетычнага падаўжэння [н¯ '] праз вынасную -н-: начиНе, і інш.;

  • ужыванне розных гістарычных формаў даўномінулага часу.

Гэты пералік удакладняюць моўныя рысы украінскага паходжання, якія ўказваюць на паўднёва-заходнюю лакалізацыю спіса Сінад. №752, а дакладна на тэрыторыю поўдня Брэсцкай вобласці:

  • абазначэнне гука [і] перад ётаванымі галоснымі з дапамогай графемы ї: грыгорї", жытїе, ^пуmенїе і інш.;

перадача [j] праз вынасную літару И: в стаН маЛжеНскиИ (М:12б) і інш.;

  • змешанае выкарыстанне и – h: повhвшы (<повившы) св"тую феwдору положили ее во гробh;

  • ужыванне пры перадачы якання формаў тыпу мовечы, трuдечы і інш.;

  • флексія -ови давальнага і меснага склонаў назоўнікаў адзіночнага ліку мужчынскага роду: а товаришови милому, гдви слuгою зостала і інш.

На дадзеным этапе лінгвагеаграфічны падыход у межах беларускага мовазнаўства прадстаўлены Дылекталагічным атласам беларускай мовы і шматлікімі навуковымі працамі, прысвечанымі гаворкам паасобных рэгіенаў (Юрчанка Г. “Дыялектны слоўнік: З гаворак Магілёўшчыны”, Слоўнік беларускіх гаворак паўночна-заходняй Беларусі і яе пагранічча, Бялькевіч І. “Краёвы слоўнік усходняй Магілёўшчыны” і інш.). На жаль, на дадзеным этапе развіцця стварэнне электроннай БД з’яўляецца праблематычным і не праводзіцца. У іншым кірунку пайшлі рускія калегі-філолагі, у прыватнасці Удмурцкага універсітэта, якія, беручы ўдзел у падрыхтоўцы Лексічнага атласа рускіх народных гаворак, ад пачатку арганізавалі працу ў электронным фармаце. Такім чынам, акрамя сістэмы “Манускрыпт” у шэрагу найноўшых інфармацыйных распрацовак, якія значна спрашчаюць тэксталагічныя даследаванні ў гістарычнай марфалогіі, з’явілася лінгвагеаграфічная сістэма “Дыялект”.

БД і спецыялізаваны web-модуль сістэмы “Дыялект” дазваляюць уводзіць і рэдагаваць лексічны матэрыял, сабраны па апытальньках Лексічнага атласа рускіх народных гаворак, праводзіць выбарку дадзеных і атрымліваць вынік ў выглядзе лінгвакарты ў Інтэрнеце.

У дадзеную праграму ўключаны лексічныя, словаўтваральныя, лексіка-словаўтваральныя пытанні, якія ахопліваюць максімальна шырокае кола рэалій з усіх абласцей гаспадарчага і духоўнага жыцця.

Сістэма “Дыялект” дазваляе ў рэжыме он-лайн картаграфаваць матэрыял, атрыманы ў выніку апытання інфарматараў на тэрыторыі Удмурціі па любым з пытанняў, закладзеных у праграму. Сістэма дае магчымасць візуалізваць пэўны арэал дыялектнай сістэмы, параўнаць арэалы суадносных лексічных адзінак. Напрыклад, карта, якая ілюструе пытанне “Дзіцятка дзікага кабана (адз.л.)”, паказвае, што лексема кабанёнок адзначана ва ўсіх населеных пунктах, дзе адбываўся збор матэрыялу.Таксама праграма ілюструе сінанімічныя намінацыі вепренок, дикарь, полосатик з указаннем месцаўжывання, дадзеных інфарматара і збіральніка. Выніковыя дадзеныя можна візуалізаваць у каларыстычным фармаце (Малюнак 3.1 і Малюнак 3.2)



Малюнак 3.1

Малюнак 3.2 

Значкавая сістэма картаграфавання дазваляе візуалізаваць адразу некалькі рознаўзроўневых дыферэнцыяльных прыкмет, што робіць аналіз больш глыбокім. Як бачым на прыкладзе адной лексемы, сістэма “Дыялект” дазваляе атрымаць уяўленне не толькі пра лексічны арэал рускіх гаворак, але і пра іх фанетычную і словаўтваральную варыятыўнасць.

Стварэнне падобнай беларускай сістэмы, заснаванай на дыялектных адрозненнях паўднёва-заходніх, паўночна-ўсходніх і сярэднебеларускіх гаворак, спрыяла б дакладнай крышталізацыі дыялектнага пласта і пераводзіла б дыялекталогію са сферы дыяхраніі (з прычыны састарэласці пазначаных у ДАБМ звестак) у сферу сінхраніі (пастаяннага абнаўлення матэрыялу).

Разгледжаныя ў працы ІТ значным чынам спрашчаюць алічбоўку старажытных рукапісных тэкстаў і спрыяюць хуткаму, сістэматызаванаму іх аналізу. Адметнай характарыстыкай прааналізаваных праграмных прадуктаў з’яўляецца тое, што і сістэма “Манускрыпт”, і сістэма “Дыялект” прапануюць варыятыўныя спосабы вывядзення вынікаў, тым самым дапускаючы апрацоўку рэзультатаў з дапамогай іншых камп’ютарных праграм. Так, атрыманыя статыстычныя падлікі лёгка табліцызіруюцца ў прылажэнні MS Office Excel. Сродкі аналізу MS Office Excel дазваляюць правесці матэматычныя, лагічныя аперацыі з выбраным матэрыялам і зафіксаваць атрыманыя рэзультаты графічнымі сродкамі – праз дыяграмы.


Заключэнне


На мяжы ХХ –ХХІ стст. актуалізаваліся паняцці інфармацыйная прастора, інфармацыйныя тэхналогіі, інфарматызацыя грамадства, атрымалі свой дэнатат словазлучэнні гістарычная інфарматыка, сацыялагічная інфарматыка, гуманітарная інфарматыка. Пашырэнне інфармацыйнай прасторы абумовіла павышэнне інфармацыйнай культуры грамадства: камп’ютарныя тэхналогіі пачалі глыбока замацоўвацца ў прыватных навуковых дысцыплінах. Менавіта такой тэндэнцыяй быў спрычынены зварот філолагаў-лінгвістаў да прыёмаў і метадаў камп’ютарнага адлюстравання і аналізу тэкставых адзінак. У гэтых інтэнцыях былі створаны разгледжаныя ў рэфераце праграмы “Манускрыпт” і сістэма “Дыялект”. Модулі гэтых праграм даюць карыстальніку шырокі магчымасці па шматкрытэрнай выбарцы матэрыялу, дазваляюць ў разнастайнай форме візуалізаваць вынікі аналізу. На жаль, на дадзеным этапе БД сістэмы “Дыялект” прадстаўлена гаворкамі Удмурціі (РФ), а сама праграма не дазваляе падключаць іншыя БД (хаця ў беларускай дыялекталогіі пакуль такой і не створана). Больш прыдатнай у плане працы з канкрэтным тэкстам з’яўляецца сістэма “Манускрыпт”, якая (хай сабе, і праз шэраг цяжкасцяў) дапускае ўвядзенне ў БД свайго ўласнага тэксту і яго прапрацоўку.

На жаль, падводзячы высновы інтэграцыі ІТ і гістарычнай марфалогіі, мы можам гаварыць хіба што пра распрацоўкі рускіх навукоўцаў (Баранава, Маргуліса і інш.). Тэхналагічныя распрацоўкі ў сферы гістарычнай граматыкі, калі і існуюць, то не маюць шырокага розгласу, а беларуская гістарычная граматыка, відаць, месціцца ў цёмных калідорах АН РБ і прадстаўлена невялікай колькасцю іменаў (А. Балыкіна, А. Оськін, В. Сідарцаў)


Бібліяграфічны спіс

  1. Алешин, Л. И. Гуманитарная информатика: аспекты проблемы // Технологии информационного общества - Интернет и современное общество: труды VI Всероссийской объединенной конференции. Санкт-Петербург, 3 - 6 ноября 2003 г. [Электрон. ресурс]. – СПб.: Изд-во Филологического ф-та СПбГУ, 2003. – Режим доступа: http://conf.infosoc.ru/03-r1f01.html, дата доступа: 05.12.09

  2. Баранов, В. А. Автоматический морфологический анализатор древнерусского языка: лингвистические и технологические решения [Электронный ресурс] / В. А. Баранов, А. Н. Миронов, А. Н. Лапин, И. С. Мельникова, А. А. Соколова, Е. А. Корепанова // «EVA 2007 Москва» : 10-я юбилейная междунар. конф. – Москва, 2007. – Режим доступа : http://conf.cpic.ru/eva2007/rus/reports/report_1130.html. – Дата доступа: 05.12.09

  3. Вигурский, К. В., Пильщиков, И. А. Информатика и филология (Проблемы и перспективы взаимодействия) // Журнал ЭБ [Электрон. ресурс] – М., 2003. –№3. – Режим доступа: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2003/part3/VP. – Дата доступа: 0.12.09

  4. Информационные технологии в образовании / [авт. – сост. О. А. Минич]. – Мн: Красико-Принт, 2008. – 173 с.

  5. Лихтер, Ю. А. Археологический источник и база данных. Выбор модели. // Труды III конференции Ассоциации "История и компьютер" [Электрон. ресурс] // Под редакцией Л. И. Бородкина, В. С. Тяжельниковой. – Режим доступа: http://kleio.asu.ru/aik/krug/3/5.shtml. – Дата доступа: 05.12.09

  6. Маргулис, И. С. Проект “Гиперазбука (объединённый алфавит славянских символов)” [Электрон. ресурс] – Режим доступа: http://manuscripts.ru/mns/docs/Margulis.pdf. – Дата доступа: 03.12.09

  7. Шапир, М. И. Филология как фундамент гуманитарного знания: Об основных направлениях исследований по теоретической и прикладной филологии // Антропология культуры. М., 2002. Вып. 1.

  8. Cleminson, Ralph. Unicode for slavists or how to slice a pineapple [Electronic resource]. – 2007. – Mode of access: http://manuscripts.ru/mns/docs/unicode_cleminson.pdf.. – Date of access: 03.12.09

Прадметны паказальнік да рэферата


Б

БД 3, 8, 9, 12, 14, 16

д

дадзеныя 5, 13, 15, 19



і

інфарматыка 4, 5, 16

інфармацыйныя тэхналогіі 3, 4, 16

І

Інфармацыйныя тэхналогіі 5



М

Манускрыпт\ 6, 7, 8, 9, 10, 12, 14, 16

м

марфалагічнага аналізатара 10, 11



п

пошук 12


С

Сістэма \“Дыялект\ 15

Ф

Філалогія 4



Э

Электронная публікацыя 7




Інтэрнэт-рэсурсы ў прадметнай вобласці


http://odrl.pushkinskijdom.ru/

Сайт аддзелу старажытнарускай мовы інстытута рускай літаратуры РАН. Сайт мае шырокія навігацыйныя магчымасці і, што самае цэннае, праводзіць электронную публікацыю ўсіх выданняў пачынаючы ад 1980-ых.



http://www.cslav.org/links.htm

Сайт уяўляе сабой каталог рэсурсаў, тэматычна звязаных з праваслаўем. У спіс уваходзяць як сайты непасрэдна рэлігійнага характару, так і рэсурсы даведачнага характару.



http://ksana-k.narod.ru/

Дадзены сайт з’яўляецца асабістай электроннай бібліятэкай Кадочнікавай А. Г., якая з мэтай павышэння якасці працы з дакументамі размясціла іх ў Інтэрнеце. Сайт складаецца з раздзелаў: “Біблія”, “Мовы”, “Блог” і інш. Асноўную каштоўнасць уяўляюць электронныя фарматы рукапісных тэкстаў, змешчаныя на сайце, а таксама вялікі корпус вучэбнай літаратуры па стараславянскай і старажытнарускай мовах.



http://www.synaxis.info/

Бібліятэка праваслаўных рэсурсаў. Сайт мае раздзелы: Synaxis, Alphabet, Tradition, якія змяшчаюць тэксты малітваў, службовых кніг у электронным фармаце.



http://cmrs.osu.edu/rcmss/contacts.html

Сайт зыніцыяваны Коледжам гуманітарыных навук пры Ахайскім універсітэце. Навуковая бібліятэка з аб’емным корпусам арыгінальнай і навуковай літаратуры для ўсіх медыявістаў.



http://old-rus.narod.ru/

Сайт прысвечаны старажытнай літаратуры, увесь корпус якой разбіты на тэматычныя раздзелы. Існуе таксама падзел па часавым крытэрыі. Для аблягчэння чытання тэкстаў на сайце змешчаны слоўнік старажытнарускай мовы.



http://www.sciencedirect.com/

Сайт забяспечаны добрай сістэмай хуткага пошуку, што дазваляе знаходзіць патрэбную літаратуру, калі вядомыя толькі частковыя бібліяграфічныя дадзеныя выдання. Артыкулы з навуковых зборнікаў можна заказаць і набыць у фармаце PDF.



http://books.google.com/

Дадзеная служба пошукавай сістэмы Google значна палягчае працэс пошуку навуковай інфармацыі, выдаючы найбольш рэлевантныя адказы на запытанні карыстальнікаў. Пры гэтым служба прапаноўвае on-line арыткулы, у т. л. нават класічныя работы, сярод якіх, напрыклад, зборнік арыткулаў па сацыялінгвістыцы “Sociolinguistics: The Essential Readings” (by Christina Bratt Paulston, G. Richard Tucker).



http://www.journals.cambridge.org/

Сайт дае магчымасць пазнаёміцца з анатацыямі работ, якія выйшлі ў выдавецтве навуковай літаратуры “Cambridge University Press”. Ёсць магчымасць набыць навуковыя часопісы і зборнікі, падаецца дакладная бібліяграфічная інфармацыя па кожным артыкуле, атаксама існуе магчымасць пошуку на сайце па ключавых словах, што з’яўляецца вельмі каштоўным дадаткам.



http://www.meertens.knaw.nl/

На сайце прыводзіцца каштоўная інфармацыя пра навуковыя праекты і распрацоўкі, якія вядуцца ў дадзены час у розных краінах, падаюцца тэзісы дакладаў міжнародных канферэнцый, змяшчаюцца навіны ў навуковым свеце.


Персанальны сайт



http://www.milkin6ljah.narod.ru/

Граф навуковых інтарэсаў


Магістранткі Навіцкай Л.М.

Філалагічны факультэт

Спецыяльнасць “Мовазнаўства”

Сумежныя спецыяльнасці

  • 10.02.20 – параўнальна-гістарычнае, тыпалагічнае і супастаўляльнае мовазнаўства

  1. Параўнальна-гістарычныя даследаванні, якія маюць за мэту вывучэнне з прымяненнем кампаратывісцкіх метадаў алагічных адносінаў паміж асобнымі мовамі і групамі моў, вывучэнне гісторыі гэтых моў і груп моў, правядзенне рэканструкцыі папярэдніх станаў на ўсіх моўных узроўнях




  • 10.02.03 – славянскія мовы

  1. Даследуюцца сучасныя і старажытныя, жывыя і мёртвыя славянскія мовы і дыялекты, зафіксаваныя ў пісьмовай форме ці існуючыя ў вуснай форме, кадыфікаваныя ці рэканструяваныя.

  2. Даследуюцца кантакты славянскіх моў паміж сабой, а таксама з неславянскімі мовамі ў сінхранічным і дыяхранічным аспектах.




  • 10.02.21 – прыкладная і матэматычная лінгвістыка

  1. Даследаванні з дапамогай матэматычных метадаў і метадаў камп’ютарнага мадэліравання разнастайных моў і дыялектаў у сінхраніі і дыяхраніі




Асноўная спецыяльнасць

10.02.01 –

беларуская мова

  1. Развіццё навукі аб беларускай мове і гісторыя вывучэння беларускай мовы.

  2. Дыяхранічныя і тыпалагічныя праблемы станаўлення, развіцця і функцыянавання беларускай мовы. Беларуская мова ва ўзаемасувязях  з іншымі славянскімі мовамі.

  3. Шляхі і праблемы развіцця беларускай літаратурнай мовы. Перыядызацыя гісторыі беларускай мовы і этапы яе развіцця. Старабеларуская мова. Мова помнікаў беларускага пісьменства..

  4. Праблемы беларускай дыялекталогіі і лінгвагеаграфіі. Дыялектны падзел беларускай мовы. Дыялектныя асаблівасці ў галіне лексікі, фанетыкі, словаўтварэння, марфалогіі і сінтаксісу. Арэальныя даследаванні.

  5. Даследаванні па сучаснай і гістарычнай фанетыцы, фаналогіі, графіцы, арфаграфіі, лексіцы, фразеалогіі, лексікаграфіі, граматыцы і словаўтварэнню сучаснай беларускай мовы.







Спадарожныя

спецыяльнасці



  1. Тэкст як форма і неабходная ўмова існавання літаратурнага твора

  2. Праблемы літаратурных узаемасувязей




  • 24.00.01 – тэорыя і гісторыя культуры

  1. Культуралагічныя ідэі і канцэпцыі, накірункі у кантэксце культурна-гістарычнага развіцця чалавека

  2. Параўнальны аналіз менталітэту гістарычных эпох, тэндэнцый, сімвалаў і духоўных феноменаў сусветнай і нацыянальнай культуры.



  • 07.00.09 – гістарыяграфія, крыніцазнаўства і метады гістарычнага даследавання

  1. Междысцыплінарны синтэз метадаў гістарычнага даследавання і іншых навук (філасофіі, педагогікі, псіхалогіі, лінгвістыкі, сацыялогіі, эканомікі, паліталогіі, матэматыкі, інфарматыкі)












Прэзентацыя магістарскай дысертацыі







Бібліяграфічны спіс да выпускной работы


  1. Важнік, С. А. Тры стыхіі Байнэта, або Праява нацыянальнай моўнай самаідэнтыфікацыі. Серыя: “Лекцыі па Інтэрнэт-лінгвістыцы”. Вып. 1. / С. А. Важнік; Бел. дзярж. ун-т. – Мн.: Права і эканоміка, 2007. – 54 с.

  2. Лянкевіч, А. У. Беларускі выклічнік: асаблівасці функцыянавання ў Сеціве. Серыя: “Лекцыі па інтэрнэт-лінгвістыцы”. Вып. 2. / А. У. Лянкевіч; Бел. дзяр. ун-т. — Мн.: Права і эканоміка, 2008. — 30 с..

  3. Современные информационные технологии и письменное наследие 2006 – Современные информационные технологии и письменное наследие: от древних рукописей к электронным текстам : материалы междунар. науч. конф., Ижевск, 13–17 июля 2006 г. / Отв. ред. В. А. Баранов. — Ижевск : Изд-во ИжГТУ, 2006. — 193 c.

  4. Word 2007: [перевод с англ.], Крис Гровер. – М.: Русская редакция, 2008. – 462 с.

  5. Падручнік Word [Электрон. рэсурс].  – Рэжым доступу: http://www.books.net-soft.ru/word.htm. – Дата доступу: 03.12.09.

  6. Падручнік Excel [Электрон. рэсурс].  – Рэжым доступу: http://www.books.net-soft.ru/excel.htm. – Дата доступу: 03.12.09.

  7. Падручнік Powerpoint [Электрон. рэсурс].  – Рэжым доступу: http://www.books.net-soft.ru/powerpoint.htm. – Дата доступу: 03.12.09.

  8. Падручнік Access [Электрон. рэсурс].  – Рэжым доступу: http://www.books.net-soft.ru/access.htm. – Дата доступу: 03.12.09.

  9. Падручнік HTML [Электрон. рэсурс].  – Рэжым доступу: http://www.books.net-soft.ru/html.htm. – Дата доступу: 03.12.09.





База данных защищена авторским правом ©shkola.of.by 2016
звярнуцца да адміністрацыі

    Галоўная старонка