Wiktionary:Planen för den Opbo

Vun Wiktionary

Üm en Wöörbook optoboen, dat bruukbor is, sünd en poor Vörgaven nödig. Noch mehr as bi en Enzyklopädie is dat vunnöten, dat de Indrääg in ehr Orthographie konsistent sünd. Wi mööt en Standard finnen, de för mööglichst all Leser un Bruker eenfach to verstahn un to lesen is un in den se ok mit mööglichst wenig Öven sülvst schrieven köönt. De Plattdüütsche Wikipedia schrievt aktuell na de Rechtschrieven vun Johannes Sass. Dat geev in de Wikipedia Stimmen, de gegen disse Regel weren oder de allgemeen gegen en Rechtschrievregel weren. Wi mööt uns nich an disse konkrete Rechtschrieven holen, aver en Standard warrt bruukt.

En Formatvörlaag för de Wöörbookindrääg warrt ok bruukt. Üm sik to orienteren, kann een sik de hoochdüütsche Vörlaag ankieken: de:Hilfe:Verwenden der Formatvorlage. Aver dat is nödig disse tominnst antopassen, so dat de regionalen Varianten in't Plattdüütsche ok weddergeven warrn köönt.

Toletzt mutt noch de Idee vun dat meta:Ultimate Wiktionary bedacht warrn, vun dat noch nich kloor is, wo lang de Realisatschoon noch duert.

Fragen, Vörslääg, Ideen[ännern]

Hoi,
I do not speak Platt but I have something with Wiktionary, on the Dutch and Italian Wiktionary we have a way of entering content. It has two advantages; it allows us to easily share content among different wiktionaries and, we are prepared to have our content go into the Ultimate Wiktionary. One other advantage is, that we have a big body of nds content that we want to upload and, I am pleasantly suprised to see that there is activity on this wiktionary.

What I want to do is have the first character capitalisation off so that the titles of the articles are spelled like the words are. After that I have a big file with many nds words with a German translation. This we can upload for you and give you a start. We also have some words in the "Veluws" dialect, some consider this a part of NDS..

So tell me what you think.. nl:gebruiker:GerardM - GerardM 19:46, 23. Jul 2005 (UTC)



I don't like not to write Plattdüütsch here, but for being understandable for all participants I write English.

I looked at the material on http://stade-buxtehude.de/platt/plattdeutsch.htm, that shall be inserted, and I must say, that it has some entries that are inconsistent or which are just wrong. Examples are:

  • afbreken - affgeben: Prefix af- one time with, the other without double f
  • Affkat - Afkat: one word under more entries
  • aufen=auf dem is wrong, Plattdüütsch uses op instead of auf, this is a matter of sound change dividing Low German and High German. A Low German dialect which uses auf at best is Missingsch or very degenerated
  • the entries Wust=Wurst and Dörst=Durst are showing, that the list is inconsequent in orthographic rules. The German -rs- has an mute r in Plattdüütsch.

If I look at the orthography, I guess the words are from the broader region south of the last range of the Elbe (as the name of the website already indicates: Stade, Buxtehude). The form geben is typical for this region, where elsewhere geven would be written. Also the open a/o sound as in laten/loten (German lassen) tends to be an o in this region as on the website (but not consquently: daalsetten would for sure in this region be dolsetten).

I don't want to decry the list, but as a starting point for a dictinary it is not suitable.

Another point: How should orthography be handled in general? On wikipedia we use Sass, I am seeing the point when someone states, that a dictionary shall not exclude spelling variants, that are used frequently by speakers, but how to handle differences? As an example: the variants geven and geben, shall there be two different entries for this regional variants? This means multiplying the needed effort to write the dictionary enormous (for words with much letters effected by regional differences this can mean dozens of variants). Redirects from less used variants to the main ones? This again means to define a mayor orthography. I don't have a useful answer on this question at the moment, possibly Gerard as a skilled wiktionary contributor has experiences with such problems? --::Slomox:: >< 01:00, 26. Jul 2005 (UTC)

There are several orthographys and there is consistency in the spelling within an orthography. The fact that the nds.wikipedia wants to standardise on Sass is irrelevant to a dictionary that represents the nds language, nds is not Sass but Sass is nds. The only proper way is to say this word is this orthography.
As to the load that is used for uploads; it was created while translating articles from nds to de. The fact that it multiplies your effort for a Sass dictionary is irrelevant because that is not what wiktionary is about. When you only want Sass, wiktionary is not for you. You can however indicate an orthography, it is done for traditional and simplified Chinese as well. GerardM 05:14, 26. Jul 2005 (UTC)
Hi Gerard, please tell us more about how the list was generated. I do not understand what you mean by "it was created while translating articles from nds to de". Translating of what articles? Low Saxon ones? Is my observation right that the list comes from stade-buxtehude.de? Actually Slomox comes precicely from this area. Shouldn't it be of some importance that he points to inconsistencies. Gerard, we can all agree that dialect variations have a place in a Low Saxon wiktionary. What I dislike is that you want to force content on us where we have shown that it is not correct. Besides: you are listing all entires as "noun", which is an absolute no-go. It is not OK for you to upload content where even you should accept that it is not correct. Please at least flag the words accordingly. It would also be nice to have the author of the word list take part in the discussion. As I said: dialect versions have a place, but if they do not conform to some standard, it would be nice to see them flagged from the beginning. This again indicates that the content clearly is not ready for upload.
Besides I am wondering, why you are so keen on oploading this content immediately. On July 23rd you wrote "This we can upload for you and give you a start." This (to my initial understanding) was that you wanted to help the community on nds.wiktionary.org. Now it seems to me that you just want to force these things on us regardless of whether we like it or not. I still think that this is unfair. Heiko Evermann 08:52, 26. Jul 2005 (UTC)
Yes, translating from nds to de. I did send you the list as it was used for the articles started with a. As you may see in the history we did manually correct them all. For the stuff starting with B we took them out. The article that you have is given to you as a courtesy and yes you can change the nouns for correct information. That was the point of giving it to you in the first place. That and improving on this content. The author of the wordlist is at this moment to the best of my information not available and, as is usual it is given on an "as is" basis.
As to standards, different orthografies are standards in their own right. I understand from Sabine that nds is taught in school. I am sure she will get some information on the orthography that is used in schools because in the end, this is a orthography that will prove most relevant.
As to why the hurry, because it makes sense to do it now, it will be a nice story for Wikimania. The impression that I get from you is that you basically want only one orthography; the one that you want the nds.wikipedia to standardise on. You asked for two weeks to work on the list I send you. I would appreciate it to have regularly the bits that you have worked on so that we can see progress. There is no point in uploading it all in one go.
First I had to search what wikimania is. OK, it is a conference from August 4th to August 8th 2005. I think this is not a good choice. My opinion is: we will go forward together, we will have a look at the words ant then we will import little bits step by step to check the results. After that we can do bigger stepts. If we manage that quickly that you can present it in wikimania, fine. If we don't, fine too. I will give my best and I think that we will be able to at least upload some content. But I am interested in providing a good dictionary for Low Saxon, all else is secondary. One more word about the orthography: a wiktionary is a good place to document dialect variations. Actually this is very important to me. There are dialects that are very far off and I would like to see those documented too, e.g. like "Plautdietsch". But what I do not like to see in nds.wiktionary.org is private spellings that do not conform to any standard. (Please read the opinion of Gerold Meiners below!!)
What I really need is more information about the file format that you want to use. e.g. how to list several different meanings with different translations. I would like to extend the data with some more information I would like to be able to go by your file format. Kind regards, Heiko Evermann 21:16, 26. Jul 2005 (UTC)
I will do some more work on the templates, for me this is a win win situation I add the nds translations to nl and copy the stuff to nds remove the bits that are not needed and hey presto you have some good information. :) GerardM 20:19, 26. Jul 2005 (UTC)

Take the sentence „De söss Froonslüüd sünd bannig optakelt ween.“ (The six woman were pretty tarted up.), which is according to Sass. „söss“ can also be written süs, süss, ses, söß or soss; „Froons-“ can be Fruuns-, Fruns-, Frons-, Frugens- or Frau-; „-lüüd“ can be -lüüt, -lüü, -lü, -lüde or -lüd; the whole word „Froonslüüd“ can also alternatively be Froons, Frugens, Frominschen, Wiever or Wieber; „sünd“ can be sün, sin, sind or sint; „bannig“ can be bannich or in the regions where bannig is not much used at least a dozen other words with the same meaning; „optakelt“ can be opptakelt, uptakelt or upptakelt; „ween“ can also be wesen, wäst or west. Imagine this to be a common phrase worthy to be included in a dictionary (it is for sure not), this would mean many entries! How to handle that? Gerard can you as a wiktionarist (wiktionarian, whatever?) describe how this would be handled (also in respect to UW)? This is a question of interest, I don't know (or want to imply) the answer. --::Slomox:: >< 14:11, 26. Jul 2005 (UTC)

One more opinion[ännern]

Hi everyone, I have asked Gerold Meiners, one of our regular contributors and a native speaker about his opinion of http://stade-buxtehude.de/platt/deutschplatt.htm, and I would like to copy his answer here, because it might be of interest:

quote: Moin Heiko

Grundsätzlich muss man heute jedem, der dazu beiträgt, die plattdeutsche Sprache zu erhalten, dankbar sein, aber wenn sich Sprachverderber daran machen, ihre Machwerke zu veröffentlichen, dann sollten die wenigen Verfechter von korrekten Formen und Kämpfer gegen die Lässigkeit und Verflachung auf der Hut sein. Natürlich steht es jedem frei, für sich umfangreiche Wörterlisten anzulegen, denn leider ist es ja so,dass die plattdeutschen Wörterbücher nicht sehr ergiegig sind und viele Fragen offen lassen, aber solche privaten Wörterlisten als Lexika für den allgemeinen Gebrauch herauszugeben und sogar im Internet zu veröffenlichen, halte ich für bedenklich. Wer sich dem Verfassen eines Wörterbuches widmet, sollte sich doch vorher darüber informieren, welche Grundsätze dabei zu beachten sind.Ich maße mir nicht an, derartige Grundsätze zu formulieren, aber was mir missfällt an "stade-buxtehude.de/platt/deutschplatt" will ich nicht verhehlen: Ich habe nur eine Viertelstunde die besagte Wörtersammlung angeschaut und wusste gleich, dass hier ein elender Stümper am Werke war, einer, der von Grammatik und Orthographie keine Ahnung hat oder sie absichtlicht ignorieren will, um damit bei den Vertreten des Lässigkeits-und Verflachungsprinzips Eindruck zu schinden.

  • Ich will nur ein paar Beispiele nennen,an denen zu erkennen ist, in welche *Richtung meine Kritik geht:
  • 1. aufsteht - opstünn
  • Das hochdeutsche Wort steht nicht, wie es sich gehört, im Infinitiv, und die plattdeutsche Übersetzung steht in einem anderen Tempus. Es handelt sich nur um eines von vielen Beispielen.
  • 2.aufschreiben - aufschreim
  • Die Übersetzung ist weder plattdeutsch noch hochdeutsch, sondern nachlässiges Umgangsdeutsch, das aufuschreiben, sich ein Autor schämen müsste.
  • 3. ausrichten - uutrichten
  • ausruhen - utrauhen
  • Es gibt keinen Grund dafür, die Vorsilbe "ut" einmal mit zwei u und in der nächsten Zeile mit zwei u zu schreiben. Wenn der Autor hier anführen sollte, dass Einfach- und Doppelschreibung im Plattdeutschen bei ein und demselben Wort die Regel sind, dann irrt er, denn dafür gibt es klare Regeln, die man sich aneignen kann
  • 4 das gesagt - dat seggt
  • Was der Autor sich mit dieser Wörterbucheintragung gedacht haben mag, ist mir ein Rätsel.
  • 5. Die Sammlung ist eine zufällige Auswahl. Es fehlen große Bestände aus dem Alltagsleben und erst recht aus den Bereichen, die auch in den handelsüblichen Wörterbüchern zu kurz kommen.
  • 6 Der Unterschied zwischen Groß- und Kleinschreibung scheint in der Stade-Buxtehuder Wörtersammlung keine Rolle zu spielen. Warum "Annersrüm" und "Aufgewachsen" groß geschrieben werden, erklärt sich vielleicht dadurch, dass sie am Fundort am Anfang eines Satzes standen.
  • Ich könnte noch viele negative Beispiele anführen, aber je länger ich in dem Machwerk lese, um so ärgerlicher werde ich. Wenn sich in Zukunft die Plattverderber vermehren sollten, sehe ich schwarz um unser geliebtes Platt.

So perhaps this helps you Gerard, to see that Slomx and I are not the only ones who have some reservations about the collection that you want to import. I hope that you can understand the German. (If not, I would offer to give you a translation into English. Just tell me.)

Kind regards, Heiko Evermann 15:30, 26. Jul 2005 (UTC)


Ein automatisches Eintragen von Wörtern aus Wörterlisten halte ich nicht für sinnvoll, da dort zu viele Fehler auftauchen und sowieso noch einmal alles (von Hand) kontrolliert werden müßte. Außerdem wäre es sinnvoll, bei Substantiven anzugeben, welches Geschlecht diese haben. --172.176.4.19 19:31, 26. Jul 2005 (UTC)


Niederdeutsch - Möglichkeiten[ännern]

Nachdem hier einiges an Diskussion, über welche Schreibweise usw. korrekt ist, läuft bin ich so weit gegangen, mich ans Institut für Niederdeutsche Sprache zu wenden und ebenso an die Universitäten und Schulen, die Niederdeutsch unterrichten. Ein Paar Anmerkungen im Voraus, die ich per Telefon erhalten habe - ich werde weiteres per E-Mail erfahren/erhalten.

  • Es gibt ca. 8 verschiedene Klassifizierungen von denen, und hier zitiere ich meinen Kontakt "der alte Sass einer ist", der gerade wieder dabei ist modern zu werden.
  • Wenn man dann weiter geht, kommt man auf 200 bis 400 unterschiedliche Ressourcen, die auch in vielem unterschiedliche Schreibweise verwenden
  • Es macht Sinn alle Wörter hochzuladen, die irgendwie verwendet werden und diese mit "nicht klassifiziert" zu kennzeichnen, so lange sie keiner "Schreibweise" zugeordnet werden können, aber irgendwo in einem Text verwendet werden.
  • Dies bedeutet, dass wir innerhalb der einzelnen niederdeutschen Wörter auch die Verbindungen zu den anderen herstellen sollten - dass heisst Sass schreibweise zu der eines anderen (die Namen erfahre ich wie gesagt per E-Mail) und umgekehrt, denn der Durchschnittsmensch weiss kaum, in welcher Schreibweise ein Text ist. Wiktionary dient dazu, den Menschen eine Sprache näher zu bringen und diese verständlich zu machen - also müssen alle Wörter hinein, die potentiell gesucht werden können.
  • Ich bitte Euch, in der Liste von Werner so weit wie möglich zu kennzeichnen, welche die Sass-Schreibweise ist - die anderen kommen dann als nicht klassifiziert mit rein. Der Rest der Liste sollte noch vor Wikimania hochgeladen werden, eben um die Möglichkeit zu haben, das Projekt bekannt zu machen - und: es ist auch wichtig, den Leuten etwas zu geben, an dem sie arbeiten können - prinzipiell haben wir massenhaft Wortlisten in anderen Sprachen und man könnte diese benutzen um zu sagen: hier fehlt nds - bitte vervollständigen (auch dies könnte mit einem Tag geschehen).
  • Also bitte schickt mir das, was Ihr machen könnt bis zum 30. Juli zu, damit wir sie zum Hochladen vorbereiten können - es ist nicht das Ende der Welt wenn nicht alles 100%-ig ist - wir sind ein "lebendes Projekt" und wollen, dass andere mit uns daran arbeiten.
  • Im Prinzip kann alles was nicht klassifiziert ist auch eine falsche Schreibweise sein - also kann dies, sobald es feststeht so "gekennzeichnet" werden, bzw. bei nichtklassifiziert, sollte man davon ausgehen, dass diese zu prüfen sind. Allerdings sind die Einträge eventuell wichtig um die Texte, aus denen sie stammen, verstehen zu können.
  • Was Wikipedia betrifft, so ist die Sachlage anders, denn Wikipedia hat anderen Inhalt - in diese Diskussion möchte ich mich nicht einmischen und ich werde es auch nicht tun. Eventuell werde ich meine Meinung auf meinem Blog auf http://www.wesolveitnet.com, einem Portal für Übersetzer, veröffentlichen - nur das ist dann meine Meinung, die zitiert werden darf - diskutieren werde ich darüber nicht.

Soviel also zum jetzigen Stand - ich werde weitere Informationen, die ich erhalte, nach und nach hier veröffentlichen. Ich werde übrigens aus technischen Gründen auch als Admin kandidieren - es kann nötig sein, Einträge vom Bot schnell zu löschen, sollte etwas schief gehen und das sollte dann möglichst immer gleich gemacht werden, wenn ich es bemerke. Schönen Tag noch! --SabineCretella 10:01, 27. Jul 2005 (UTC)

Ist die Struktur der Einträge nur für den Import der Liste ausgelegt oder sind Dinge wie Bedeutungserklärungen in Plattdeutsch, Synonyme, Geschlecht etc. usw. bereits eingeplant? Wenn ich wüsste, wie das einzubringen ist, dann könnte ich versuchen die Liste auszumisten (auf jeden Fall notwendig vor dem Upload!), die Schreibweisen nach Sass anzumerken und wo nötig die benutzte Orthographie etwas konsequenter anzuwenden (dafür wären aber etwas mehr Infos über die Genese der Liste nützlich). Gerold Meiners könnte sicher auch oldenburgische Varianten beisteuern.
Die bisher hochgeladenen Einträge haben diese Struktur:

######
{{-nds-}} 
{{-noun-}}  
#'''WOORTinNDS'''; 
{{-trans-}}
{| border=0  width=100%
|-
|bgcolor="#FFFFE0" valign=top width=48%|
{|
:*<nowiki>{{de}}: [[WORTinDE]]
:*{{en}}: [[WORDinEN]]
|}
| width=1% |
|bgcolor="#FFFFE0" valign=top width=48%|
{|
|}
|}
&&&&&&
</nowiki>
Die letzte Tabelle scheint überall leer zu sein, ist die für weitere Dialektformen? Pluralformen (die sollen doch keine eigenen Einträge bekommen, oder?) und Geschlecht müssten noch ergänzt werden. Lautschrift wäre auch noch eine Möglichkeit.
Den Zeitdruck, in einer Woche fertig werden zu wollen, finde ich allerdings etwas störend. Besonders, wenn gleich zu Anfang die Qualität des Wörterbuchs darunter leiden könnte. --::Slomox:: >< 13:03, 27. Jul 2005 (UTC)
Also das mit dem Zeitdruck: was geht, geht - was nicht: wird nach und nach hinterher gemacht. Wir fangen mit einer Liste an, von der aus man dann arbeiten kann. Es macht keinen Sinn erst alles hinzufügen zu müssen, weil man dann nämlich "ewig" an der Liste arbeitet.
Ich hatte das anfangs auch auf dem italienischen Wiktionary - aber: Menschen sind nicht perfekt und so wird es auch Wiktionary nie sein. Es wird mit der Zeit allerdings immer besser und kommt der Perfektion immer näher. :-)
Es ist alles - von Definitionen bis Synonymen, Antonymen, Beispielen usw. vorgesehen - wir schreiben halt immer nur das rein, was wir auch haben. Z.B. hätte ich sagen können, dass ich erst 'mal alle italienischen Übersetzungen zu den Wörtern dazu schreibe - nur: wenn ich das tun würde, dann bräuchten wir ewig - irgendwann mache ich oder jemand anderes das schon. Vergesst nicht, dass es mit Ultimate Wiktionary wesentlich leichter wird bzw. am Anfang wird auch das gewöhnungsbedürftig sein, danach wird vieles viel schneller gehen, zumal wir tbx import/export haben werden - und dass ist wirklich ein riesen Fortschritt - vielleicht sind diese Abkürzungen so viel wie Chinesisch für Euch - ist auch klar, denn es geht um einen Standard, der bei Übersetzungen verwendet wird.
Zum Aufbau der Seite - ich füge hier 'mal die Definition usw. ein:

######
{{-nds-}} <hier kommt je nach Schreibung z.B. {{-nds-sass-}} usw. rein. Diese Templates können wir selbst entscheiden, denn der zweite Teil ist kein ISO-Code.
{{-noun-}}  
#'''WOORTinNDS'''; <Definition>
{{-trans-}}
{| border=0  width=100%
|-
|bgcolor="#FFFFE0" valign=top width=48%|
{|
:*<nowiki>{{de}}: [[WORTinDE]]
:*{{en}}: [[WORDinEN]]
|}
| width=1% |
|bgcolor="#FFFFE0" valign=top width=48%|
{|
:*{{ru}}: <hier werden weitere Übersetzungen eingefügt - z.B. auch die anderen nds Schreibweisen>
|}
|}
&&&&&&
</nowiki>
Dadurch, dass das Sprachtemplate oben auf der Seite z.B. nur nds ist, kann man erkennen, dass es noch nicht klassifiziert wurde - dies schreiben wir dann auf die Seite der Kategorie, in der all die mit nur nds gekennzeichneten Wörter zu finden sind. Wenn beim Durchgehen der Liste z.B. eine Schreibweise festgestellt wird, dann ergänzt man das erste Template ganz einfach mit der Schreibweise und so wandert das Wort automatisch von der "zu kategorisierenden Kategorie" in die richtige Rechtschreibkategorie.
Pluralformen: diese haben eine eigene Seite, die auf die Hauptform verweist. Man muss nicht jedes Mal schreiben "Pluralform von" [[Wort]] - es reicht aus, wenn man da ein Template verwendet. Dasselbe gilt auch für Verben. Wir haben auch das template {{-phrase-}} mit dem die Redewendungen usw. gekennzeichnet werden. Es gibt auf anderen Wiktionaries (auch auf dem Englischen) bereits Projekte, die an einem Phrasebook arbeiten.
Also wie gesagt, die Pluralformen, Verbformen usw. bekommen ihre eigene Seite - außerdem wird nds zum UW gehören, was ja gerade für so "kleine Sprachen" interessant ist, da viel mehr Leute an den Einträgen arbeiten und mehr Admins da sind, die Unfug vermeiden bzw. die entsprechenden Leute darauf aufmersam machen, dass etwas zu prüfen ist. So arbeiten wir alle weniger und haben bessere Resultate. Redirects gehen beim UW verloren - dort müssen eigene Seiten aufgebaut werden, da wir es mit einer relationalen Datenbank zu tun haben.
Templates: Gerard wird eine Seite aus dem niederländischen Wiktionary hierher kopieren, auf dem alle bisher verwendeten Templates vorhanden sind. Dort werden wir dann die speziell hier verwendeten hinzufügen und diese natürlich auch auf die anderen Wiktionarys übertragen (ganz wichtig ist dabei, diese auch auf dem niederländischen Wiktionary einzutragen, denn es ist praktisch der Ausgangspunkt für die Strukturierung).
Ich hoffe, ich habe jetzt alles beantwortet. Wenn nicht: stoss mich bitte mit der Nase drauf - bei mir ist zwischen Arbeit, Kindern, Wiktionary und im Moment auch Wikimania usw. ziemliches Chaos. Danke! Ciao!!! --SabineCretella 17:17, 27. Jul 2005 (UTC)

Umfang des initialen Uploads[ännern]

Hallo Sabin,

ich möchte den Umfang des Uploads noch einmal thematisieren:

Es macht Sinn alle Wörter hochzuladen, die irgendwie verwendet werden und diese mit "nicht klassifiziert" zu kennzeichnen, so lange sie keiner "Schreibweise" zugeordnet werden können, aber irgendwo in einem Text verwendet werden.

Nein, es macht nicht Sinn alle Wörter hochzuladen, die man irgendwo im Internet findet. Es macht nur Sinn, Wörter hochzuladen, die sich tatsächlich sinnvoll belegen lassen, und für die klar ist, aus welcher Schreibtradition sie tatsächlich stammen.

also müssen alle Wörter hinein, die potentiell gesucht werden können.

Nein, niemand sucht definitiv falsche Schreibweisen, z.B. fehlerhafte Groß-/Kleinschreibung, fehlerhafte Konjugationen etc. Ein gewisses Maß an Ordnung muß sein.

Ich bitte Euch, in der Liste von Werner so weit wie möglich zu kennzeichnen, welche die Sass-Schreibweise ist - die anderen kommen dann als nicht klassifiziert mit rein.

1) Ich habe von Gerard, soweit ich das bisher gesehen habe, bisher nur die Daten für a und b erhalten, die ja schon importiert wurden. Ich dachte, es ginge zunächst einmal darum, die weiteren Imports durchzusehen, bevor sie durchgeführt werden.

2) Noch einmal: die Liste enthält Wortmaterial, das nach jeder Schreibweise falsch ist. Mein Vorschlag ist, daß Slomox und ich dieses Material korrigieren. Wir können dieses Material gerne beiseitelegen und uns zu einem späteren Zeitpunkt mit der Frage befassen, wie mit diesen Worten zu verfahren ist. Hilfreich wäre es auch, diese Problemfälle mit dem ursprünglichen Autor dieser Wörter zu diskutieren.

Der Rest der Liste sollte noch vor Wikimania hochgeladen werden, eben um die Möglichkeit zu haben, das Projekt bekannt zu machen - und: es ist auch wichtig, den Leuten etwas zu geben, an dem sie arbeiten können -

Wenn Du damit meinst, daß wir das Material hochladen sollten, über das wir uns einig sind, dann gern. Wenn Du damit aber meinst, daß wir alles (auch die Problemfälle) mit hochladen sollen, dann stimme ich dagegen.

Also bitte schickt mir das, was Ihr machen könnt bis zum 30. Juli zu, damit wir sie zum Hochladen vorbereiten können - es ist nicht das Ende der Welt wenn nicht alles 100%-ig ist - wir sind ein "lebendes Projekt" und wollen, dass andere mit uns daran arbeiten.

Na du bist mir witzig. Heute erhalte ich endlich die Definition des Importformats, heute ist Donnerstag abend. Die durchzusehenden Daten habe ich noch nicht bekommen. Die bekomme ich von Euch ja frühestens im Laufe des Donnerstags. Dann kann ich am Donnerstag abend erstmals damit arbeiten. Am Freitag abend kommt unser Bibelkreis uns am Samstag ist Sabbat. Der Tag ist mir heilig, den werde ich nicht damit verbringen, den ganzen Tag eine Wortliste von 2000 Einträgen durchzusehen. Und wenn Du dann am Samstag abend anfangen willst, den Rest, der dann noch nicht durchgeladen ist, hochzuladen, dann fühle ich mich überfahren. Und das bloß um für die Wikimania etwas zum präsentieren zu haben? Stell dir mal vor, was passiert, wenn Du mit diesem Material an die Öffentlichkeit gehst? Meinst Du etwa das würde unserer plattdeutschen Sprache etwas nützen? Vielleicht nützt das Eurem Ego etwas, aber unserer plattdeutschen Sprache nützt das nichts. Das kommt dann nämlich in der Presse bloß ins Gerede.

Im Prinzip kann alles was nicht klassifiziert ist auch eine falsche Schreibweise sein - also kann dies, sobald es feststeht so "gekennzeichnet" werden, bzw. bei nichtklassifiziert, sollte man davon ausgehen, dass diese zu prüfen sind. Allerdings sind die Einträge eventuell wichtig um die Texte, aus denen sie stammen, verstehen zu können.

Das ist nicht richtig. Falsche Schreibweisen führen nicht dazu, daß man die Wörter nicht wiedererkennt. Für das Verständnis von Plattdeutsch ist die Kenntnis von eindeutig falschen Schreibweisen, z.B. falscher Groß- und Kleinschreibung sicherlich nicht nötig.

Also das mit dem Zeitdruck: was geht, geht - was nicht: wird nach und nach hinterher gemacht. Wir fangen mit einer Liste an, von der aus man dann arbeiten kann. Es macht keinen Sinn erst alles hinzufügen zu müssen, weil man dann nämlich "ewig" an der Liste arbeitet.

Das ist einfach nicht wahr. Ich habe zugesagt, so zügig wie es mir möglich ist, an dieser Liste zu arbeiten, und ich denke, daß wir es sicherlich schaffen würden, ein paar hundert Wörter hochzuladen, über die wir uns alle zusammen einig sein würden. Ich bin auch gerne bereit, diejenigen Daten, die ich für falsch halte beiseite zu legen, damit Ihr sie auch ansehen könnt. Es ist nur eben so, wie ich schon mehrfach versucht habe zu erklären, daß es wesentlich leichter ist, eine lange Liste in einem Texteditor durchzusehen und zu bearbeiten als jeden einzelnen der Einträge im Browser zu öffnen. Der wiktionaryserver ist ja nicht der schnellste. Das heißt also: dafür daß Ihr eine schön hohe Zahl von importieren Einträgen melden könnt 1) kommt nds.wiktionary.org von Anfang an in der niederdeutschen Gemeinde ins Gerede 2) haben Heiko, Slomox und wir anderen viele, viele Stunden Extraarbeit. Und das ist es, was mich daran so besonders ärgert. Ich habe Frau und zwei kleine Kinder und ich habe eine Arbeit, die mich zur Zeit sehr fordert, und ich habe diese die Zeit für diese Extrastunden Nacharbeit, die Ihr uns hier aufhalsen wollt, einfach nicht.

-nds- <hier kommt je nach Schreibung z.B. -nds-sass- usw. rein. Diese Templates können wir selbst entscheiden, denn der zweite Teil ist kein ISO-Code.

-noun- Das wird nicht so einfach funktionieren. Bei einer ganzen Reihe von Wörtern sind sich jeweils verschiedene Schreibweisen einig. Da kann man aus -nds-sass keine Hauptkategorie des Eintrags machen. Richtig wäre Haupteintrag -nds- und ein Unterverweis: z.B. nach Sass, Harte. ggf. samt Links zu alternativen Schreibungen. Das zeigt mir übrigens auch, daß noch mehr Vorarbeit geleistet werden muß. Für mich heißt das klar und deutlich, daß wir zunächst an Hand eines kleinen Wortschatzes von höchsten ein paar Dutzend einträgen anfangen sollten und erarbeiten sollten, wie diese Inhalte korrekt auszusehen haben. Und dann kann es weitergehen. Bis dahin kann man ansonsten nur das Material hochladen, über das Einigkeit besteht. Das würden ja auch vielleicht 400 Wörter werden.

Zu guter letzt möchte ich jetzt eine definitive Zusage von Dir Sabine und von Gerard haben, daß ihr weiteren Content nur hochladet, sofern dieser zwischen allen Teilnehmern abgestimmt ist. Ansonsten werde ich diese Angelegenheit auf der wiktionary-Mailingliste eskalieren. Ich möchte, daß nds.wiktionary.org ordentlichen Inhalt hat, und Qualität geht mir vor Zeitdruck. Und Zeitdruck von zwei Tagen halte ich, gelinde gesagt für eine Unverfrorenheit und ich wünsche mir, daß damit endlich Schluß ist.

Und bevor ich für heute abend schließe, möchte ich noch einmal rückfragen, ob ich euch richtig verstanden habe, nicht damit wir aneinander vorbeireden. Ich habe folgendes verstanden.

  • Slomox und ich möchten die Liste gerne bereinigen, Fehler in der Groß-/Kleinschreibung, offensichtliche Fehler in der Rechtschreibung korrigieren. Wir würden Einträge, die wir derzeit nicht importieren möchten, beiseite legen und würden diese Einträge gerne mit Euch diskutieren.
  • Ihr wollt, daß wir die Einträge nach Sass/nicht-Sass klassifizieren und wollt sie dann so hochladen, wie sie sind.

Habe ich damit Euren Standpunkt richtig wiedergegeben?

Hartlich Gröten,

Heiko Evermann 22:37, 27. Jul 2005 (UTC)

Ich bin grad etwas irritiert. Heiko, du schreibst oben, du hättest bloß a und b erhalten, du hast doch die Liste an mich weitergeleitet (!?), die hatte 2134 Einträge von Aant bis Zoon. Dann schreibt Gerard in der Mailingliste von 2775 Einträgen. Wie geht das zusammen? --::Slomox:: >< 00:40, 28. Jul 2005 (UTC)

Ich habe gerade versucht ein paar Einträge abzuarbeiten und es tauchen noch jede Menge grundsätzliche Fragen auf.

  • Was ist mit Flexionsformen: laat kann zu late werden, das muss doch Widerklang im Eintrag finden, doch in welcher Form?
  • Das Geschlecht wurde wo doch gleich eingetragen?
  • Wie werden mehrere Definitionen des Wortes voneinander getrennt?
  • Was Heiko schon ansprach, es gibt Wörter, die sind überall gleich, die müssten eigentlich unter -nds- fallen. Wörter ungeklärter Verbreitung müssten mit irgendwas -nds-X- mäßigem gekennzeichnet werden. Was ist mit Sonderformen, die stark regional sind, zwar in Literatur vorkommen, aber keiner umfassenderen Orthographie folgen? Gibt es dafür eine Sonderkategorie/vorlage?
  • Wie soll man mit Germanismen umgehen, die im Plattdeutschen Sprachgebrauch allgegenwärtig sind, aber definitiv nicht originär Plattdeutsch? Auf Grund der kompletten Zweisprachigkeit aller Plattdeutschsprecher können diese sich nahezu beliebig in einem Kontinuum zwischen Plattdeutsch und Hochdeutsch bewegen, was dazu führt, dass ein großer Teil der hochdeutschen Wörter in dieser gewissen Hinsicht auch Plattdeutsch sind. Umso komplexer das Wort umso wahrscheinlicher ist es, dass es im Plattdeutschen in Hochdeutscher Form benutzt wird, obgleich eine Übertragung ins Plattdeutsche problemlos möglich wäre.
  • Sehe ich das richtig, dass Vorlagen mit Bindestrichen Kategorien erzeugen, während solche ohne blo0 Text erzeugen, oder gibt es weitere Unterschiede zwischen Vörlaag:de und Vörlaag:-de-?

Und das ist noch lang nicht alles. --::Slomox:: >< 01:20, 28. Jul 2005 (UTC)

Arbeitsteilung Slomox, Heiko[ännern]

Hallo Slomox, (und hallo Sabine) Du hattest recht, die Datei enthält 2135 Einträge. Importiert wurde bis "basch", also bis Nummer 134. Vorschlag: du kümmerst Dich um 135-1134 und ich mache 1125 bis 2124. Mein Vorschlag ist zunächst einmal die Grundformen der Einträge zu machen und zusätzliche Konjugations-/Deklinationsformen beiseitezulegen. Wir sollten sie aufbewahren, aber wir sollten mit solchen Formen erst einmal abstimmen, wie sie behandelt werden sollen. Mir wäre es dabei insbesondere wichtig, daß sie von Anfang an eine Referenz auf den zugehörigen Wurzeleintrag bekommen und das geht schneller in der Datei zu bearbeiten.

Was meinst Du dazu?

Ich kann mir vorstellen, eine erste Charge von vielleicht 50-100 Einträgen heute abend durchzusehen. Diese würde ich dann an Sabine schicken und wir könnten sie mal testweise importieren. Danach hätte ich am Wochenende Zeit und könnte Sonntag abend, also am 31. Juli noch einmal eine größere Zahl von Einträgen liefern.

hartlich Gröten,

Heiko

Fehlermeldungsseite??[ännern]

Wäre es möglich, eine "Fehlermeldungsseite" einzurichten für die "unsinnigen" Einträge, also diejenigen, die - soweit nachvollziehbar - in keiner Schreibweise sinnvoll sind? Hauptsächlich handelt es sich dabei um vorschnell importierte Einträge. Das würde vielleicht auch den Admins helfen. --172.183.88.37 20:25, 5. Aug 2005 (UTC)

Dafür habe ich Wiktionary:Löschkandidaten ein gerichtet. Im Übrigen finde ich, dass Einträge, die automatisch hochgeladen wurden und kein Platt sprechender Benutzer kennt oder im Wörterbuch findet, gelöscht werden.

Sarcelles 10:16, 12. Aug 2005 (UTC)

Ich denke, wir sollten den gesamten Bestand, der schon importiert ist, einmal durcharbeiten, wo nötig und möglich sollten wir die Einträge geradeziehen. Und was nicht zu gebrauchen ist, wird markiert. Dann können wir uns das noch einmal gemeinsam ansehen und danach kommt das in de Tünn, was nicht zu retten ist. Heiko Evermann 11:35, 12. Aug 2005 (UTC)

Ich bin jetzt aber echt sauer[ännern]

Bei der Suche, ob bestimmte (meiner Meinung nach) falsche Wörter so im Internet überhaupt verwendet werden, habe ich festgestellt, daß die gesamte Liste (inklusive allem Mist) am 1. August in das italienische Wiktionary importiert wurde. Ich kann mich darüber nur wundern. Was soll das? Ihr wißt doch, daß wir die Liste hier für das plattdeutsche Wiktionary durchsehen, um sie zu überarbeiten. Was soll so ein Mist? Wenn Ihr irgendwann einmal einen Datenimport ins Ultimate Wiktionary macht und diese Daten aus it.wiktionary.org mitnehmt, dann kommt der ganze Mist automatisch wieder rein. Heiko Evermann 20:34, 12. Aug 2005 (UTC)

Es gibt ja zwei italienische Wiktionaries, wo sie is. Eine Sprache-Zwei Dialektwörterbücher. Dies ist ja kein Dialektwörterbuch. Ich habe mich bereits -wie ich glaubte eindeutig- auf ihrer Diskussionsseite geäußert. Sie ist jedenfalls mit selbem Benutzernamen auf de.wikipedia vertreten.
Sarcelles 10:49, 14. Aug 2005 (UTC)
It is not really relevant what you think is correct nds.
Gerard, if that is the case, then neither is relevant what you think about the word list that you want to import here. BUT: if there are several people who know the language well, tell you that the list is problematic, then you should really take that to heart. I have also given examples and I am willing to go further into details to show you the problems with this list. You however just say that everything that you find somewhere is all right. That is not a good way to build a dictionary. A dictionary needs one thing above all others, and that is quality.
There are many orthographies and they all are "correct". When you want to do a good job on this; you can identify what orthography they belong to. But it takes propably a lot more knowledge to be able to categorily say what is wrong.
Definitely no. Just one example: Bedingunk (condition) is not Low Saxon but a misspelled High German word. Marking this word as nds is clearly wrong. Words on "-ung" are imports from German. However a LS word for this exists, it is "Beding", and besides it has a different gender in LS. Bendingung is "missingsch" at best, but even then it should be spelled with "-ung" and not with "-unk". Just a proposal: try dumping words misspelled like this into de.wiktionary.org, mark them as "-de-" and tell people that every word has its right and that you know at least one person who writes German that way. Then wait for what will happen in de.wiktionary.org and see whether these entries will survive. Heiko Evermann 13:30, 14. Aug 2005 (UTC)


The Sass orthography is just one orthography. Given the fact that the sources of the wordlists have a pedigree, it is not possible to dismiss them out of hand without showing an POV that is incompatible with the values of the Wiktionary project. The only acceptable way is identifying the orthography and until research has indicated what orthography they belong to, nds is a proper way of indicating them,
No. If there is serious and proven doubt then the one who enters the data is responsible and must answer where these words come from, who uses the word and which spelling system these entries belong to. If that is not possible, then of course the doubters seem to be correct and the errors will be corrected. I do know quite a lot about spelling systems in Low Saxon and some things in this list are way off according to all spelling systems that I know. It is really time for you to show more credible proof for your data, e.g.
  • Which texts was the data extracted from? (to be included into stade-buxtehude.de)
  • Who was the author of those texts? When were they written? Where were they published?
  • What is the underlying spelling system? To our opinion it is inconsistent. That should not be the case.
  • Which other dictionaries support this spelling? When it comes to our proposals and changes, we can back these up with dictionaries. Can you do likewise? Or can you just point to stade-buxtehude.de and its mirrors? Now that would be circular reasoning. Please understand that we will not let you get away with that. If however you can prove your data, we will find ways for these entries to get an appropriate representation in nds.wiktionary.org.
I do not dismiss entries "out of hand" but after thoughtful analysis and after looking up all these things in several dictionaries, just to see whether there is any chance that these entries might be correct. I also google for the words in question. And then I make my decision what to do with these entries. As Jimbo states it "be bold". When there are errors, I correct them. Period. One more thing: the most important entries in nds.wiktionary.org have to be the usual ones, those that correspond to spellings that are really used. If you enter lots of very private spellings, then you give a wrong impression about Low Saxon. Again: try this anywhere else in *.wiktionary.org and see whether your edits will be accepted. My guess is that they won't exist for long. Heiko Evermann 13:30, 14. Aug 2005 (UTC)
It is also really relevant to understand the meaning of words; Niederdeutsch includes the Dutch language so we are talking about Lower Saxon here. Lower Saxon is nds and it has Dutch and German varieties. GerardM 12:36, 14. Aug 2005 (UTC)
First of all, this list is in very many cases of doubtful linguistic correctness.

Even leaving aside the fact that this dictionary has an intended scope beyond Low Saxon. Sarcelles 12:59, 14. Aug 2005 (UTC)

An answer that can be read[ännern]

First of all by splitting the reply that I gave you in many seperate pieces, you destroy the integrity of my answer. First of all, the discussion we are having is about methodology and is not about what I know or you know about Lower Saxon. Where you have people interested in the nds.wikipedia supporting you, we are looking into sources like institutes that spend there time on Lower Saxon. We do not begrudge you the fact that you speak some forms of Lower Saxon, we do not think that you know all forms of Lower Saxon.

I am not interested in fighting over each and every word. So I will not do it. The provenance of the material the word list is built on is known. So given the way of the wiki, it is a list that can be used to build initial content. This can be enriched and where it is wrong, words can be deleted as well. If you consider a word to be "Missingsch", it is not wrong it's a word whose label needs adjusting.

There is an essential difference between de and nds, and you are missing this; German is a language that is there for all the German speakers while there is no such thing as the Lower Saxon language. The consequence is that a nds word without the indication for an orthography or dialect is incomplete while in German it is enough.

Your assertion that it is up to the person entering data to include information about orthography is also open for discussion. You apparantly want instant perfection, but from my point of view the entries that you made do not indicate an orthography or dialect and are therefore incomplete. On the Italian wiktionary and the Ultimate Wiktionary we want good content and we are not afraid to have content that will be removed when it is wrong. We want information even if it is no more than a correct spelling of a word. If you want to do have different ways of doing things, realise that it is up to you to make your endeavour a success. I hope however that we can somehow find a way to cooperate because the current way of endless e-mails and "discussions" will not help the creation of a quality resource for the Lower Saxon dialects and orthographies. GerardM 14:40, 14. Aug 2005 (UTC)

The point with Missingsch is that it is neither High German nor Low Saxon. This means these entries would need a seperate template. This can be done in one or the other Italian Italian wiktionary. Furthermore I know about Missingsch being spoken in four German states, but not in Low Saxony, whence the entered words are. Another problem I have is that many Missingsch words are not known generally. I cannot see the point in uploading a list of words that is at 30 % mainly unusual vocabulary of a semidialect.

Also: There are two German languages, not one German language and Low Saxon. Sarcelles 16:25, 14. Aug 2005 (UTC)

Hi Gerard,
I think you misunderstood me. So I will try and explain what I mean:
1) words that are written in one of the mainstream orthographies can of course be entered immediately. They should somehow (so far we have not discussed how to do that in a way that does not break your robot framework) link to each other and should show which version belongs to which orthography and to which dialect area. In a lot of cases different systems and different dialects overlap to a great degree. Therefore it does not make sense to have main headings -nds-sass- or -nds-westphalian-. This should be done in a separate paragraph like "Varianten".
2) words that do not fit into any of the mainstream orthographies should preferably not be entered at all or should at least be clearly labelled as deviant from the standards. And for these words I would really like to see proof that the words are actually used in this way. The big splitup of LS into lots of very private spellings is a burden for the language and we should really use nds.wiktionary.org to point people to current standards. (Which includes Sass and some more)
3) It is a burden to import a huge list which does not follow the standards and I would really like to see some kind of proof that these words conform to some kind of standard, because I (and others) really doubt that. It is much quicker to edit the list in text form before importing them, and we have offered to do so.
So much for today. I do not have more time tonight. Kind regards, Heiko Evermann 17:24, 14. Aug 2005 (UTC)

Dialektbostenen[ännern]

Dat gifft kene Dialektbostenen. Ik wüll vörslan, dat dat noh ,, Holsteener Platt, ,,Mönsterlänner Platt" etc. mokt warrt un nich noh ,,Holsteen", ,,Westfalen", ,,Rhienland", ,,Bremen" etc. Man de Indelen, de ik an anner Steed hie schreven heb, is nich good naug. Sarcelles 11:55, 13. Aug 2005 (UTC)

Ik slag vör, Noordamerika buten to laten, man Plautdietsch dobi to hebben, de Nedderlannen dobi top hebben, man Däänmark nich.

Sarcelles 17:26, 13. Aug 2005 (UTC)

Languages[ännern]

When you find time to identify the nds word for the languages that have not been identified yet, I can help you with some more content. eg on Hoochdüütsch many have still not been identified. GerardM 15:01, 14. Aug 2005 (UTC)

If there are no words, it has to be accepted like it is, I think.

Sarcelles 16:26, 14. Aug 2005 (UTC)

http://nds.wikipedia.org/w/index.php?title=Westplatt&oldid=4499 hett ,,west-nedersassische", wat ik

as ,,Westneddersassisch" verwendet heb. Is dat nich en ,,Neologismus "? Ik heb hie den Bidraag Westneddersassisch schreven (evtl. Schuuven nah de Wikipedia). Sarcelles 21:02, 14. Aug 2005 (UTC)

Sarcelles, för Fragen, de nich mit den Opbo vun't Wiktionary direkt to doon hebbt, is dat hier nich de richtige Platz. Richt di dorför doch en extra Siet in. --::Slomox:: >< 23:58, 14. Aug 2005 (UTC)

Important Questions[ännern]

By the rivers of Babylon (sing)

Is it possible to answer the question, when the Ultimate Wiktionary will be available? I think this is a very important question for the creation of content, that has to match the demands of the UW.

I have not seen so far a good concept, how to handle different spelled, but otherwise identical words, also fitting non standardized languages. Masses of identical entries with slightly differing lemmas, which have to be updated individually when you make a correction, can't be the solution. I will not work in a project doubling and re-doubling the needed time and effort only because of working in an environment, which doesn't allow to make entries without having this lemmatic POV (only one spelling can be the lemma). What we need is a software allowing to have entries with several possible lemmas. Or shall we make templates so different spelled forms use the same content? But this would only be a very ugly workaround. It is ridiculous when we have different entries for Lüüd, Lüü, Lüü', Lüüd', Lüüt, Lüüt', Lü, Lü', Lüd, Lüd', Lüt, Lüt', Lüü'e, Lü'e, Lüe, Lüde and Lüüde. This can't work. And you need much more capable manpower than available to sort out, which spelling is in which spelling tradition or whatever. If you can't aquire dozens of capable and engaged Low Saxon linguists you only will get a big messed up dump of word forms not being usable in any form. Wiktionary is based on the work of engaged amateurs not having the expertise to do this job accurately. The needed media literacy (competence in media, Medienkompetenz) of the reading users would be too high, because the single entries wouldn't be trustworthy enough. (I hope my comment is understandable, even in German I have problems to express it in a form that is not misunderstandable) --::Slomox:: >< 23:58, 14. Aug 2005 (UTC)

You raise several questions and let me reply them one at a time.
For Ultimate Wiktionary a schedule has been published, it says that in September the software should be ready. General availability may be later. As to the demands of the UW, the consistency of the data is key. When Sass orthography is indicated as such, it will make it more relevant than just the indication that it is nds.
One good way of indicating Sass would be using a template like {{nds-sass}}. As it is the stated aim to have a Sass resource it would really help if words are indicated as such.
It does indeed make sense to only include what you know. This way as an amateur you can do a lot of good work. When a word like "Lüüd" has many varieties you would work on the varieties that you really know.
Certainly with a resouce as a database, it does not matter how many varieties we have; harddisks are cheap. Yes, it would take experts to work on some of the thorny issues that may arise. It is therefore relevant that Sabine is getting into contact with universities and other organisations to get their cooperation in making the wiktionary information on nds as relevant as humanly possible.
As to the rivers of Babylon, there will be many misunderstandings but as long as we are willing to listen to each other and are willing to cooperate it will not become a "Babylonische spraakverwarring". GerardM 14:25, 15. Aug 2005 (UTC)
Hi Gerard,
I have had a look at the data design diagram of UW. I have some questions and have not found the answers in the diagram:
* Will it be possible to flag an entry as conforming to several nds dialects and to several nds spellings? Will it be possible to query the database for -nds- as a whole? e.g. -nds-westphalian-? For -nds-sass? The problem is that these things overlap very often. Or would that require to have complete entries for each variation? I think that this is a very crucial question. It would not make sense to multiply similar entries.
  • Will there be an easy way to navigate between different dialecs or spelling systems of one language or would these only appear as "translations"?
  • Will it be possible to add explanations about certain aspects of grammar, to explain why certain variants exist, to explain the underlying system? One example: Jahr becomes Johr in Sass orthography, because the long o before a became a real o. This is not the case before other consonants. Another spelling system (that is very parallel to Sass in most other cases) writes "Jahr". So it would be important to have a quick navigation between these to and to have a quick link to the explanation who uses which variant and where.
  • Will it be possible to add inflection tables for a word? (like in [1] Will it be possible to have a quick link from inflected forms to the root entry (infinitive in most languages)? It would not make sense to add translations like "maakt" to "he makes, we make, you make, they make". It would be sufficient to link to the infinitive "maken".

Kind regards,

Heiko Evermann 18:18, 15. Aug 2005 (UTC)

Thanks for having a look at the data design.
It will not be possible to flag one entry as conforming to many dialects. When it is a requirement to flag an existing entry as valid for other orthograhies as well, it should be easy to create some logic that will create the necessary records to do just that. It does make sense to have entries for words for different orthorgraphies as it will help in the creation of data for spell checkers.
Explanations about grammar are very much needed. The best place to have this data is not immediately clear; many of this kind of information can be included in Wikipedia or Wikibooks.
In an explanation it will be possible to link to other resources. This is what wikilinks, interwiki links and interproject links are about. These should remain available to us because they are what makes the Wikis so valuable.
In the ERD you will find that inflections can be defined for a language and a particular part of speech. This will allow you to tailar exactly which inflections are needed for a language. The inflecions can than be created and it can be defined to what infinitive or other headword they belong to. For many languages software exists that can create standard inflections. This will help us generate many inflections for the regular verbs and nouns etc. For translators and certainly in the combination with translation software it makes sense to have translations for inflections. This is less straightforward than you may think. Some languages have different inflections depending on the gender of the subject. GerardM 13:48, 16. Aug 2005 (UTC)
I think it should really be possible to flag one word as conforming to many different standards. This is quite important for Low Saxon: several dialects and several different spelling systems. And in many cases they overlap. So do you really want to enter "is" for nds-sass, nds-harte, nds-lindow, nds-ans, nds-mecklenburg-ans, nds-hamburg-ans, nds-harte-westphalia, nds-oostfreesch-ans, nds-oostfreesch-sass etc? That does not make much sense to me. I think that in this regard the design should be changed. The same is valid for de: de-traditional, de-new, de-ch, de-de, de-au etc. Do you really want to multiply all the entries? That is almost the same as treating nds-sass-hamburg and nds-harte-mecklenburg and nds-lindow-oostfreesland as completely separate languages. Or is there something that I have misunderstood?
What I meant with grammar is: in many cases it is desirable to give explanations about the grammatical features that apply to a certain entry, e.g. change between a/o in different spelling, transitive vs. intransitive usage, warnings for different usages like English for/since or English among/between or Low Saxon Klöör/Farv. Both are translated into German as Farbe, but there is an important difference. Klöör is the color (hue), Farv is the paint. So when you have a LS entry Klöör you should be able to link to Farv and explain to the reader that there is an important difference between Farv and Klöör. The reader (in the browser interface) should immediately get this information. Therefore I think that such data should be placed directly into the database of UW, perhaps as a free format text withi wiki markup, that can also contain wikilinks to other UW dictionaries. This is certainly useful for many other languages, too.
Heiko Evermann 18:19, 16. Aug 2005 (UTC)

Hm, orthographies are made by people, who write dictionaries. So flagging entries as Sass, Harte or whatever means copying their books into UW. The more relevant thing are different dialects, already because people as Sass tried to make dictionaries, that are fitting all dialects, kind of compromises.

The normal writer of Low Saxon sentences writes following the sound he makes when speaking words and following his feeling. Most writers therefore don't follow any orthography. They write as they think it sounds. I asked my grandparents for some Low Saxon place names, I didn't know, and although they grew up in places just two kilometers apart and now living together for over 50 years they couldn't agree on one spelling in some cases. It demonstrates, there are enough varieties to even show up in one family. A standardized language as High German has 115.000 Entries in the most relevant dictionary, the Duden, plus some hundred thousand (or million?) special or technical terms. Low Saxon has for every term many possible spelling varieties. They aren't wrong, because nobody has the authority to say 'this is wrong'. But must this mean, that we have to collect all this varieties, just because nobody has the final authority to say, they are wrong? I think, No. On our discussions so far I came to this conclusion: When we want to represent the regional spelling and pronounciation we should define a set of regions where the dialects are nearly fully comprehensible and then have spelling rules for this local dialects, to which all entries must correspond. When a word doesn't match such a region, we need a kind of map (describing in words or a real) showing the use of a word (not a spelling variety). This work of defining has to be made by real experts. This would be a prescriptive approach, but a descriptive approach is not feasible, when no clear structure is visible (you spoke of 200 varieties). Descriptive would be building a tower of Babel, just not feasible. --::Slomox:: >< 22:24, 16. Aug 2005 (UTC)

I think that you can flag entries as "according to Sass". They made rules about orthography for other people to use. (The rules itself are copyrighted and we cannot copy them into the wikipedia. I have asked the chairman of Fehrs-Gilde about that and they are a bit strage about that. Nevertheless there should be some way to explain the content of the rules together with examples and the underlying intention without violating their copyright.) Flagging words like that would not mean by itself that we copied their dictionary. We would have words that they have not listed, which are nevertheless according to their rules. We would not copy their translations and example phrases. We would not go through their dictionary to copy the list starting by a and ending by z. We would come to word lists in other ways, e.g. through our own articles, or through KDE op Platt or through marless.de (and we should be able to document how we got to those lists) and when we integrate one of these words into the wiktionary we would then also have a look at what Sass has to say about the orthography and the plural forms.
Last night I thought about flagging words as -nds-sass-. If that really is what Gerard needs, then maybe it is ok. It would however mean to elevate nds-sass to a language :) . What I so far have not understood is what this means for entries from German to LS. e.g. German "Jahr" => "Johr" (Sass) and "Jahr" (Lindow). Would that mean that the German entry has two different translation entries for Low Saxon like
  • Englisch: Window
  • Plattdüütsch (Sass): Johr
  • Plattdüütsch (Lindow): Jahr
  • Plattdüütsch (Harte): Johr
  • Plattdüütsch (Hermann-Winter): Johr
  • Franzöösch:an
  • Esperanto: jaro
Looks a bit strange to me.
Comments?
Kind regards Heiko Evermann 06:54, 17. Aug 2005 (UTC)
Given how we already do things with Chinese it would be more like:
  • Englisch: Window
  • Lower Saxon:
Harte: Johr
Hermann-Winter: Johr
Lindow: Jahr
Sass: Johr
  • French: an
  • Esperanto: jaro
When people like Sass or Harte develop an orthography, they do this with the intention that it is used. Therefore they cannot license this work in such a way that we cannot indicate words to belong to their particular orthography. From my perspective not having a standardised orthography says something about the usability of a language; by sharing an orthography the usability of a language is enhanced as more people are able to easily read it.
When you want to add content to Wiktionary, and you want to make your addition relevant, you have to indicate the orthography it belongs to. It is that simple. Without it your grandfather is as correct as your grandmother or as you are. It makes excellent sense to decide to work only on a few orthographies and I would not be unhappy when only a few of the 200 orthographies find their way into the Ultimate Wiktionary. However in the end I am really outspoken about one thing: for nds without the indication of the relevant orthographies, I think any entry is worth much.
With a descriptive aproach and with indication of the used orthography, you do not build a tower of Babal you deliniate what belongs to what. UW will allow you to specify what language / dialect / orthography you want to see. The consequence is that the interest for many orthographies will only be academic. GerardM 07:06, 17. Aug 2005 (UTC)

Ok lets be practical now[ännern]

I have updated Nedderlandsch. I added one template -nds-sass-. Please give it a nice description in for instance wiktionary:Sass orthograhy and explain what Sass is. I have added one template -info- that is to link to the nds.wikipedia. The text is wrong, please localise the text for me.

Decide that you follow Sass and have only words in Sass with translations. All the other orthographies can be treated as foreign words.. So they would go like Nederlands; the difference would be that they ARE nds but -nds-xxxx-. This is indicated in two lines like with Nedderlandsch.

When you do your research and you find that a word is Missingsch, please do not delete it. You may think it a mongrel but it is not your mongrel. The right way forward is to indicate it as Missingsch. It will find its own space in the database and one way of looking at it is that it is a positive contribution. By doing this you get more recognition as well.

Pronunciation can be best done by creating sound files, the way I prefer to do is by creating soundfiles like you find in Nederlands, you can have a SAMPA or an IPA as well. Using transcriptions in a language like nds is asking for problems so please use objective standards for this.

As to the import files, when we do an upload, it looks exactly like what you see on an edit screen. The only difference is a top of page and an end of page marker. When a word already exists, an upload is abandoned. GerardM 10:01, 18. Aug 2005 (UTC)

Hi Gerard,
I have added text for -info- and for -nds-sass-. The description page itself (Wiktionary:Schriefwies na Sass) will certainly take some more time to write. I have copied the formatting from -nds-. Now I am not sure whether that is correct. It is now on the same level of indentation (==) as -nds-. Does that mean that -nds- should be left out? When I look at Nedderlandsch now, the content list starts with
1 Plattdüütsch
2 Plattdüütsch (Schriefwies na Sass) 
2.1 Substantiv
2.2 Översetten 
2.2.1 Mehr Informatschoon

is that right?

Concerning pronunciation, sound files might be interesting. But for that we need someone with a good accent to make them, or even several people from different regions. That looks like a whole project of its own and is certainly much more than we can handle at the moment. (But for later it is a good idea).
SAMPA or IPA might also be complicated. What I had in mind was something very different. In LS we have a special situation for long "e" and long "ö", which come in two flavours: diphthong and monophtong. For these two sound the difference is not indicated in SASS. This has some historic reasons, having its roots in the German base of the spelling. Some people nowadays do not even make this distioncion in speaking, and it is important (at least to some people) to indicate this properly.
The variants are
  • "äh" and "äy", both written as "e", at least where standard German has "e"
  • "öh" and "öy", both written as "ö"
And this must be indicated as an explanation, preferably under "Utspraak/pronunciation", where -ä- -äy- etc would be macros linking to an explanation page.
Kind regards, Heiko Evermann 21:40, 18. Aug 2005 (UTC)

Evaluating some recent changes[ännern]

An evaluation of the recent changes is to be done in two parts. The first part is to evaluate the process of the changes that are done. The second part is to evaluate the end result as a function of its usability for import into the Ultimate Wiktionary.

The process of the changes is lossy. Words are moved to what is apparantly the Sass orthography. This means that the practice is discriminatory in favour of Sass. It only means that we will have to newly introduce the same words again and qualify them as a particular nds orthography.

For the import; Afkaat is useless as it does not state its orthography - appeldwatsch is ok - window refers to Finster but that is nds and not nds-sass. So it is very much a mixed bag; not much can be said about it given the current quality. As code tends to produce more standardised content, it is either good or horribly wrong. GerardM

Hi Gerard,
My question was: is the syntax of the articles correct or not. This is important to me, because there is quite a lot of data that I want to import, and I do not want to work over all the data again, just because of a syntax error. Could you please check the syntax, so that I know whether or not I have to adapt my template.
Words are indeed moved to Sass orthography. Not to 'apparently', but actually, because I do verify each and every one. They are marked as such, unless there is something that I overlooked. (Some cases may have slipped my edits, but I hope that there will be some database query that lists those that I do miss.)This is not discriminatory in favour of Sass. This is just cleaning up a huge mess that you have imported. Anyone else is free to add content in other orthographies, if it is flagged properly. I have made a big step towards you by incicating these words as nds-sass instead of nds (as I had wanted to). Now please do not complain about that. The same words of Werner will certainly not be imported again, unless they are backed up with proof that they are right and unless they are flagged as nds-something, which would not be -nds-werner-, but something serious. They are full of errors and inconsistencies and these words will certainly not stand in the wiktionary shouting 'Hey I am -nds- (as in -nds-common-), and Heikos entries are only -nds-sass-.' I do try to substantiate his words, I do quite a lot of googling, but the net result is that I come to the conclusion again and again, that a lot of his words. I cannot find the correct -nds-xxx- to flag his words (even after quite a lot of search), and as you keep saying: without a proper flag these words are useless. And whatever is useless just deserves being deleted.
Regards, Heiko Evermann 07:36, 21. Aug 2005 (UTC)
Give me a named example of a noun an adjective and a verb and cram it full with all the information that you have on it and I will tell you if it is good. nl:WikiWoordenboek:Lijst van messages is where you find all the current messages in use on the nl.wiktionary.
Your assertion that you clean up a mess, does not take into account the removal for words being Messing.. Your assertion that people are only allowed to add stuff as nds when it is flagged as a particular orthography is just that; your assertion. You can obviously delete what you like on the nds.wiktionary if that is the way you prove your case then I am impressed. When a word is identified as nds, it is useless when using a specific orthography. It is useless for building a spelling checker however, as these words actually have been used, it is best to find where they came from. Sabine is doing research and you have been informed about this. You apparantly can not wait for the results.. Therefore my conclusion can only be that according to your googling you assume you have the authority to decide what is the truth for the nds language.. I am impressed by this audacity. GerardM 14:28, 21. Aug 2005 (UTC)

Aah[ännern]

So the pywikipediabot is not that difficult after all!!! Just juse the right subprogram... => Afstand

Kind regards, Heiko Evermann 22:27, 18. Aug 2005 (UTC)

Structure Luft[ännern]

Hi everyone, I have thought about the structure for quite some time. My conclusion is that each and every Low Saxon article should have a dialect overview (Sass, Lindow, East Frisian etc). This would be the most transparent way to do things. The same applies for the way back.

Any comments are welcome.

I know that this will probably break the current import scripts for the ultimate wiktionary. (BTW: the current database design is still not suitable for representing the Low Saxon dialect situation...) But I think that according to the lines I proposed in Luft we can at least find a good representation of the dialect variety in nds.wiktionary.org. And we can deal with the import in UW later. (I would be willing to help then.)

Kind regards,

Heiko Evermann

Vorschlag für neues Makrokonzept[ännern]

Moin tosamen,

ik heff mi vundaag 'n nieges Makrokonzept utdacht, un dat verkloor ik op Hooch, dormit jedereen dat verstahn kann.

  • Ausgangsbasis ist die Tatsache, dass wir es bei Platt mit einer Vielzahl von regionalen Varianten und abweichenden Schreibweisen zu tun haben. Die können nicht alle unter Haupteinträgen laufen. Andernfalls ist die Konsistenz der Einträge nicht sicherzustellen.
  • Die Verschiedenen Varianten können auch nicht sinnvoll im Übersetzungsblock stehen, denn nds-Harte ist eben keine Übersetzung von nds-Sass sondern nur eine andere Schreibweise desselben Worts.
  • Damit ist klar, dass die Strukturmakros der anderen Wiktionaries (die Gerard uns vorgeschlagen hatte) nicht ausreichend sind.
  • Ich habe eine Struktur für die Makros überlegt, die den Inhalt komplett in Makros (Vorlagen) verpackt. Damit ist es zu einem späteren Zeitpunkt möglich, Daten, die in diesen Makros verfasst werden, relativ einfach zu parsen und sie in ein Ultimate Wiktionary zu überführen. Dafür muss natürlich ein Übertragungsprogramm geschrieben werden, aber das müsste ohnehin passieren, weil das bisherige Importprogramm für das Test-UW auf die plattdeutschen Besonderheiten ja auch keine Rücksicht nimmt.
  • Das bisherige Konzept für das UW nimmt (soweit ich das bisher verstanden habe) auf Dialektvarianten auch keine Rücksicht. Ich bin mir sicher, dass das noch eingebaut werden wird, denn man kann nicht alle Lemmas für Englisch doppelt eintragen, bloß weil es manche gibt, die Englisch-US bzw. Englisch-GB sind. Und auch andere Sprachen (z.B. Sizilanisch) haben genau dasselbe Problem wie wir. Ich plädiere daher dafür, nach der Verfügbarkeit des UW noch eine Weile zu warten, bis eben dieses Variantenproblem deutlich zutage tritt, und erst dann den Import der plattdeutschen Daten ins UW zu machen. Ich biete hiermit ausdrücklich an, mich selbst um das Importskript zu kümmern, aber eben erst, wenn klar ist, dass das UW auch funktioniert und ein brauchbares Konzept für die Dialektvarianten hat. Ich komme aus der Softwarebranche und ich mag es nicht, mit Alpha- oder Betaversionen zu arbeiten.

So und jetzt noch eine Beschreibung der Makros (Kommentare sind erwünscht).

  • Beispiele sind twischen und Oort sowie die zugehörigen Varianten von Aart und tüsken
  • ein Sprachhauptblock (Plattdeutsch, Englisch, etc.) fängt mit {{Spraak-nds}} an. (Sprache einsetzen, bisher gibt es nur nds)
  • Es folgt ein Bedeutungsblock wie z.B. {{Bedüden-Präpositschoon}} oder auch einer mit erklärendem Text wie z.B. {{Bedüden|Text=Substantiv (Hoochdüütsch "Ort") }}
  • Es gibt einen Hinweisblock mit den drei Makros {{Henwiesen-Start}} {{Henwies|Text=Wohrschau: Kombinatschoon or/ar}} {{Henwiesen-Enn}}
  • Es gibt einen Variantenblock mit mehreren Makros, z.B. {{Varianten-Start}} {{Variante-Sass|Text=[[Oort]]}} {{Variante-Harte|Text=[[Aart]]}} {{Varianten-Enn}}
  • Und es gibt für Redirects auf Hauptartikel Makros wie {{Redirect-Harte|Teel=[[Oort]] }}, die einfach erklären, dies ist die Schreibweise nach Harte von xy, wobei xy ein Link auf den jeweiligen Hauptartikel ist.

Die beiden Beispiele Aart und twischen behandeln zwei besondere Problemfälle des Niederdeutschen. Das eine ist ein Viererblock von Varianten. Zwei davon sind spezifisch ostfriesisch, zwei sind allgemein (also nicht-Ostfriesisch) aber in beiden Bereichen gibt es eben zwei häufige Formen.

Das andere Beispiel ist die Doppeldeutigkeit von Oort, die sich in manchen, aber nicht allen Schreibweisen findet: Die Aussprache ist gleich, aber die Schreibweise ist bei Harte verschieden.

Ich habe auch vorgesehen, Hinweismakros wie z.B. Henwies-or zu machen, die Standardphänomene beschreibeben, im Beispielfall eben den Wechsel der Schreibweise von ar/or. Dieser soll dann einen kurzen Text enhalten samt Link auf eine Umfangreicherer Erklärung des Phänomens.

Ich denke, das ist überhaupt eine wesenliche Herausforderung bei nds.wiktionary.org, nicht nur Varianten zu nennen, sondern auch zu erklären, was es mit ihnen auf sich hat.

Herzliche Grüße, Heiko Evermann 22:33, 29. Dez 2005 (UTC)

Dat Konzept is goot. En poor lüttere Saken: De Bedüden-Vörlagen (de de Woortoort angeevt) schöölt man vun de verklorenden Henwiesen trennt warrn. De schöölt ok man lever plattdüütschen Text bruken (also staats hoochdüütsch: Ort en List mit de verscheden Bedüden as in dat de.wiktionary). Sünst maakt dat en goden Indruck. --::Slomox:: >< 23:12, 30. Dez 2005 (UTC)
Ik heff Oort nochmaal ännert. De Bedüden warrt nun op Platt verkloort. För de verklorenden Henwiesen weet ik nich, wat Du seggen wullt. Meenst Du, dat dat bloots een Indrag för Substantiv geven schall mit 1. Oort (Platz) un 2. Oort (Sort)? Dor hebb ik ok över nadacht. Man so as dat jetzt is, is dat eenfacher, dat later automaatsch na en Ultimate Wiktionary to koperen, dor bruuk ik per Bedüden de Översetten. Hartlich Gröten, Heiko Evermann 12:52, 31. Dez 2005 (UTC)

Aktualiseern[ännern]

Moin moin, ik bün hier ja nu siet en Wiel togang un heff mal ut de Praxis so en beten rutkregen, wo dat löppt un wat nich so goot is. So wiet mi dat möglich weer, heff ik de Saken ännert, de nich so goot löpen. Op jeden Fall will ik nu ok mal'n paar Wöör verleren to de bavigen Saken:

  • Keen Standard to bruken weer unsinnig, wiel dat to vele Indrääg denn geev un ein hieter Tohuwabohu. Un en ne'en Standard to grünnen wörr ok nix bringen, wiel de narms akzepteert weer un sowoso nüms vun em afweten wörr. Wi hebbt nun mal de Sass as en Standard, de in de Praxis meestdeels klappt. De wikipedia richt sich na Sass un dat löppt ok goot bether. Natürlich is de Sass nich dat gele vun't Ie, man an düsse Steed woll dat beste wat wi hebbt.
  • De Berüchsichtigen vun de verschillenen Dialekte is gar nich so swar as een dinkt. De Hööftindraag is eenfach de Sass`sche Schrievwies. Un denn direkt ünner de Vörlaag, of dat Woort en Substantiv oder Adjektiv und so is, kümmt de Block mit de Varianten. Dat gifft en Vörlaag för "na Sass" un Lindow, un denn ok en intuitive Vörlaag, wo een de Dialekt ingifft un denn de Schrievwies. Vun all de Varianten-Schrievwies gifft dat en REDIRECT na de Hööftartikel. Een dröff nich vergeten, dat Sass blots en Schrievwies is un keen Dialekt. Dat geiht ja nich dörum, de Lexik to vereenheitlichen.
  • De Kumplexität is en beten wegnahmen worrn un dat Hele süht nu eenfacher ut. Vele Vörlääg werrn eenfach to kumplizeert un unnödig. Woans ik mi dat vörstell, köönt ji ünner de Wöör vun de Week sehn oder allgemeen bi de Tutorial un de Textbosteen-Siet.
  • Ik haal nich veel vun Wiktionary in de Hensicht, dat bi jeed Wiktionary alle Spraken vörkamen mööt. Dat is doch veel to veel Spiekerplatz. To veel schallt een hervun sowoso nich vermoden. Man tominnst en godet Naslagwark kann een schapen, wo dat utföhrliche Henwiesen op de Bedüden, Etymologie, Utspraak, Översetten etc. vörkümmt. Un denn in Ümkehrslööt gifft dat bi de düütsche un anneren Wiktionarys de Översetten na Nedderdüütsch.

Sowie vun mi. Ik weet, dat ji all de Lust verlaren hebbt, her noch wat ut to maken. Man ik heff Lust dörto un ik haap, dat dör ok draad mal Lüüd kaamt, de as bi de annern wikipedias mitschrievt. Man warrt dat gewahr ;) Aver ik wörr dat Projekt nich opgeven, blots wiel dat Unklaarheiten gifft.

Un wat hett dat egentlich mit de Wöörlisten op sik? Gifft dat de noch? Künn ik dörmit wat anfangen hervör?? Zylbath 21:29, 2. Jun. 2011 (CEST)[anter]

bot flag request for YS-Bot[ännern]

I didn't find a page, where i can request bot flag, so i will add my request here:

I hereby request the Bot flag for User:YS-Bot for the following purpose: interwiki using pywikipediabot (latest version). Got flag on several wiktionarys (list). Best regards --Yoursmile (Diskussion) 10:01, 6. Sep. 2012 (CEST)[anter]

Ich habe leider keine Seite gefunden, wo ich ein Botflag beantragen kann, weswegen ich diese Seite dazu nutze. Der Bot wird hier lediglich Interwiki-Links ergänzen. Er besitzt bereits etliche Botflags (Liste). Schöne Grüße --Yoursmile (Diskussion) 10:01, 6. Sep. 2012 (CEST)[anter]

Eine dumme Frage aber bin ich als Admin dafür verantwortlich? Das muss doch ein Steward oder sowas machen, nicht? Es gibt hier allerdings niemanden anderes als mich. ;) Zylbath (Diskussion) 21:55, 13. Sep. 2012 (CEST)[anter]
Tut mir leid für die späte Antwort: nein, du musst nichts machen ;-) Ich werde jetzt bei Meta beantragen, dass mir ein Steward einen Botflag gibt. Schöne Grüße --Yoursmile (Diskusschoon) 10:05, 10. Jan. 2014 (CET)[anter]

Bot flag request for HydrizBot[ännern]

I did not find a page to place this request, but please approve of my interwiki bot. Details:

  • Botmaster: Hydriz
  • Bot's name: User:HydrizBot
  • List of bot flags on other Wiktionaries: full list
  • Purpose: interwiki
  • Technical details: pywikipediabot, latest versions

Regards. --Hydriz (Diskussion) 10:05, 21. Sep. 2012 (CEST)[anter]

Bot flag request for UT-interwiki-Bot[ännern]

Please let me know, if you need some test edits. Greetings from Austria. --Udo T. (Diskusschoon) 00:03, 15. Jun. 2016 (CEST)[anter]