Full text in Serbian only
Cvetana KRSTEV
Miloš UTVIĆ
Jelena JAĆIMOVIĆ
University of Belgrade
10.18485/KNJIZ.2015.1.24
UDC: 316.774:305-055.2(497.11)"2009/2015" 305:070(497.11)"2009/2015"
Facts Are Stubborn Things – Women in Serbian Daily Press
There are various answers to the question whether gender equality has been achieved in contemporary Serbian society. Some consider women to be absolutely equal, others think that the achieved equality has been lost; there are those who believe that it never existed and that it will be a long time before it is achieved. What could be the stubborn fact which would help us determine what the plausible answer is? Assuming that the presence of women in daily and weekly press reflects their social position, we shall attempt to discover how much and in what way women are present in Serbian papers. The research relies on corpus and computational linguistics and extraction of information. The analysis will be based on a corpus consisting of portions taken from daily papers and electronic media (Politika, Blic, Večernje novosti, Danas, B92) which have more than 600.000 words (collected 2009-2014) and a smaller extract from weekly press (Ilustrovana poltika, Bazar). The methods of computational linguistics will employ a comprehensive dictionary of the Serbian language and the extraction of information will be based on detecting the named entities with the help of grammars for shallow syntactic analysis. After evaluation, the obtained results will be examined in terms of quality and quantity.
electronic newspaper corpus, corpus linguistic, computational linguistics, women, gender equality
Цветана Крстев, Универзитет у Београду, Филолошки факултет[1]
Милош Утвић, Универзитет у Београду, Филолошки факултет
Јелена Јаћимовић, Универзитет у Београду, Филолошки факултет и Стоматолошки факултет
10.18485/KNJIZ.2015.1.24
УДК: 316.774:305-055.2(497.11)"2009/2015" 305:070(497.11)"2009/2015"
Ако коза лаже, рог не лаже – где су и ко су жене у српској дневној штампи[2]
Полазећи од претпоставке да је присуство жена у дневној и недељној штампи слика њиховог положаја у друштву, у овом раду покушавамо да утврдимо колико и како су жене представљене у српској штампи користећи се методама корпусне и рачунарске лингвистике, као и методама екстракције информација. Разматрање je засновано на корпусу састављеном од извода из дневне штампе и електронских медија (Политика, Блиц, Вечерње новости, Данас, Б92) прикупљеном у периоду 2009 – 2015, мањем изводу из женске недељне штампе (Базар) и узорку недељника Врањске. Методе рачунарске лингвистике ослањају се на коришћење исцрпног електронског речника српског језика, док се екстракција информација заснива на детектовању именованих ентитета коришћењем граматика за плитку синтаксну анализу. Добијени резултати су ручно евалуирани што нам је омогућило да утврдимо висок квалитет нашег система у препознавању имена особа, док квалитет препознавања пола именованих особа треба побољшати. С друге стране, добијени резултати нам говоре да је заступљеност жена уопште у српској штампи данас (дневној и недељној) знатно мања од заступљености мушкараца, али и да се најистакнутијим женским особама посвећује знатно мање простора него најистакнутијим мушким личностима.
електронски новински корпуси, корпусна лингвистика, рачунарска лингвистика, жене, родна равноправност