SAMANDRAG Vi diskuterer nokre grunnleggande tilnaermingar til eit datasett om normavvik («rettskrivingsfeil») i studenttekstar. Vi innfører modellar for å analysere tekstane, og vi ser på kva for type spørsmål datasettet kan svare på og kva det ikkje kan svare på. Då er det viktig å klargjere føresetnadane. Vi diskuterer òg forskjellen mellom å analysere eit datasett med tanke på å «bevise» samanhengar statistisk, og det å bruke datasettet for å fremje hypotesar. Statistiske metodar kan brukast i begge tilfella. Analysane her kan sjåast på som ei vurdering av kvaliteten i datasettet for ytterlegare analysar.
NØKKELORD utforskande statistikk, normavvik i nynorsktekstar, modellar for teljedataABSTRACT We have a dataset about misspellings in Norwegian texts written by students. We introduce statistical models to analyze the dataset, and we discuss what questions can possibly be answered by the dataset. Moreover, we clearly point out the assumptions necessary for drawing conclusions. We also discuss different approaches to a dataset, like exploratory and confirmatory approaches. The analysis in this paper can be viewed as an evaluation of the quality of the data for further analysis.
I denne artikkelen studerer vi om ein tekstforfattars generelle tilbøyelegheit til å gjere rettskrivings- og bøyingsavvik i nynorsktekstar kan estimerast ut i frå kunnskapar om forfattarens tilbøyelegheit til å gjere nokre spesielle feiltypar. Analysen indikerer at førekomsten av spesielt to feiltypar er gode indikatorar for den totale feilmengda i vårt tekstmateriale. Dei to feiltypane representerer begge avvik i vokalisme, der spesielt den eine tyder på påverknad frå bokmål som til dømes øke for auke, leke for leike, medan den andre også har innslag av munnleg påverknad som posetiv for positiv og virke for verke. Utgangspunktet er eit datasett om normavvik («rettskrivingsfeil») i studenttekstar, og vi nyttar generaliserte lineære modellar i analysen.
English abstract
Is it possible to estimate how many spelling mistakes a writer using the nynorsk language might make from his or her aptitude to write a few specific mistakes? A statistic analysis
In this text, we explore the following question: Is it possible to estimate how many spelling mistakes a writer using the nynorsk language might make from his or her aptitude to write a few specific mistakes? The analysis of our data set indicates that two particular mistake types together form a good indicator of the total amount of spelling mistakes in our material. The mistake types represent vowel divergences, where one of the mistakes in particular seems to be influenced by the majority language in Norway, bokmål: øke for auke, leke for leike. The other type seems also to be influenced by spoken language, like posetiv for positiv and virke for verke. The text material is a data set describing mistakes in student texts, and we use generalized linear models in our analysis.
Betingelser for brug af denne artikel Denne artikel er omfattet af ophavsretsloven, og der må citeres fra den. Følgende betingelser skal dog vaere opfyldt: Citatet skal vaere i overensstemmelse med "god skik" Der må kun citeres "i det omfang, som betinges af formålet" Ophavsmanden til teksten skal krediteres, og kilden skal angives, jf. ovenstående bibliografiske oplysninger.
Utviklingen av og fremtiden til det norske språket, ikke minst fagspråket, har i den senere tid vært tema for diskusjon og innspill i så vel riksdekkende medier som fagblader, så også i Tidende. I denne artikkelen, som tidligere har vært publisert som kronikk i Forskerforum nr. 3, 2005, peker førsteamanuensis Jan Olav Fretland blant annet på noen av problemstillingene som følger av norske myndigheters manglende bevissthet når det gjelder å sikre det norske fagspråket.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.