Skip to main content

Statistisches Testen

(a) Die sieben Schritte des statistischen Testens. (b) Der Chi-Quadrat-Test: Anwendungen und Beispiel.

Praxisbeispiel

Außenprüfungsfall: in einem Gewerbebetrieb bemängelt der Prüfer, dass die Tageseinnahmen nicht lognormalverteilt seien. Es wird grundlegend Erlaeutert, wie diese Tests ablaufen, und welche Fehlannahmen und Fallstricke lauern, und zu einem…

Unzulässigkeit

Es mangelt aber nicht nur an sauberer Methodik. Vielmehr ist die Annahme, dass die Lognormalverteilung das "Verteilungsideal" von Tageseinnahmen seien nur mit viel Wohlwollen auf ungenügende Lesekenntnisse zurückzuführen.

1 Herkunft des Verfahrens

Nach unseren Recherchen ist die Grundlage des Verfahrens das Buch Die neue Prüfungstechnik in der Betriebsprüfung von Erich Huber aus 2004. Hier wird die Grundlage des Tests hergeleitet, oder eher hergelitten — einen quantitativ–methodisch ausgebildeten Wirtschaftswissenschaftler schmerzt es beim Lesen. Die „Herleitung“ erfolgt in einem kurzen Absatz auf Seite 154 im Unterabschnitt 5.3.3.7.1 (sic!):

Tageseinnahmen bzw. Losungen entstehen üblicherweise zufällig durch Kombination von Preisen mit Verkaufsvorgängen. Wenn viele Zufallsgrößen bei der Entstehung einer rechnerischen Größe multiplikativ zusammenwirken, die Wirkung der Zufallsänderung also jeweils der zuvor bestehenden Größe proportional ist, ergibt sich strukturell eine bestimmte Verteilung. Bei wirtschaftlichen Vorgängen ist das die logarithmische Normalverteilung (in der Folge LogNV), die nach einheitlicher Meinung der Lehre231 bei wirtschaftlichen Vorgängen vorherrscht.

mit der Fußnote

231 Siehe Bohley, Statistik, S. 419; Bosch, Grundlagen der Statistik; S. 294, Sachs, Angewandte Statistik; S. 173; Hartung, Angewandte Statistik, S. 155 und die zahlreichen bei Ernst, FN 167 S. 135 angeführten Literaturstellen.

Wobei die Quellen im Literaturverzeichnis wie folgt angegeben sind


 Bohley, Statistik, Einführendes Lehrbuch für Wirtschafts- und Sozialwissenschaftler, Oldenbourg Verlag 1985.

Bosch, Grundlagen der Statistik; Oldenbourg Verlag 1996

Hartung, Statistik, Lehr- und Handbuch der angewandten Statistik 7. Auflage, Oldenbourg Verlag 1989.

Sachs, Angewandte Statistik, 7. Auflage; Springer Verlag 1992.

Eine irgendwie geartete auf mathematischer Statistik basierende Herleitung, weshalb die Log­normal­ver­teilung ganz allgemein für Wirtschaftsdaten gelten solle, erfolgt nicht.

2 Direkte Kritik

2.1 Formelle Kritik

Über die hier originalgetreu wiedergegebene und abwechslungsreiche Punktuation in Fußnote und Quellen kann man sich sicherlich bereits mokieren. Spannender ist allerdings die Frage, weshalb Huber (2004)

  1. Bohley in der Fassung von 1985 und nicht in der von 1999 zitiert
  2. mit Bosch, Grundlagen der Statistik ein Buch zitiert, dass nicht einmal die Deutsche Nationalbibliothek kennt (es gibt Statistikbücher von Bosch — aber keines mit diesem Titel)
  3. Hartung in der Fassung von 1989 und nicht in der 13. Auflage von 2002 zitiert
  4. und auch Sachs nicht in der 2004 aktuellen 10. oder 11. Auflage zitiert.

Veraltete Literatur zu zitieren ist ein klarer Verstoß gegen wissenschaftliche Zitiergepflogenheiten — doch sei’s drum, das sind Lehrbücher, da wird sich schon nicht viel geändert haben. Nicht existierende Literaur zu zitieren ist ein schwerer Mangel. Es gibt von Bosch Grundzüge der Statistik (ISBN 978-3486252590) und Basiswissen Statistik — Einführung in die Grundlagen der Statistik mit zahlreichen Beispielen und Übungsaufgaben mit Lösungen (ISBN 978-3486582536). Natürlich kann es nicht Aufgabe des Lesers sein, zu raten, auf welches der Werke der Autor meint, sich zu beziehen.

2.2 Materielle Kritik

Verlassen wir die formellen Unzulänglichkeiten dieses kurzen Abschnitts und gehen über zu der materiellen Analyse: Huber (2004) hat nicht ganz Unrecht, aber er hat eben auch nicht Recht. Wieso das so ist, hat er bereits von drei Statistikprofessoren in einem Verfahren — dem er (wohlweislich?) ferngeblieben ist — erläutert bekommen. Nachzulesen ist das auf den Seiten 36–40 und 128–136 in der von dieser Seite herunterladbaren  PDF–Datei der Entscheidung UFS Wien 12.3.2009, RV/0328-W/06. Auch ich erläutere Hubers grobe Fehleinschätzung hier nochmals. Dazu ist es notwendig, den Text sehr genau zu lesen, denn der Teufel liegt wie so häufig im Detail. Huber (2004) schreibt

Tageseinnahmen bzw. Losungen entstehen üblicherweise zufällig durch Kombination von Preisen mit Verkaufsvorgängen.

Dem braucht man natürlich nichts entgegenzusetzen. Preis mal Menge ergibt (Einzel-)Umsatz. Menge in den Einzelumsätzen und die Anzahl an Einzelumsätzen sind i.d.R. nicht exakt vorhersagbar. \(\rightarrow\) O.K.

Wenn viele(2) Zufallsgrößen(3) bei der Entstehung einer rechnerischen Größe multiplikativ(1) zusammenwirken, die Wirkung der Zufallsänderung also jeweils der zuvor bestehenden Größe proportional(4) ist, ergibt sich strukturell eine bestimmte Verteilung.

Auch dies ist alleinstehend richtig. Wenn sich nämlich zum Beispiel die rechnerische Größe „Jahresrendite einer Aktie“ \((1+R)\)

  1. als Produkt von, also multiplikativ,(1)
  2. vielen(2) zufälligen Tagesrenditen(3) \(r_t, t=1 \rightarrow T, T\rightarrow \infty\)
  3. mit konstantem Erwartungswert \(\mu\) und
  4. konstanter Varianz \(\sigma^2\)
  5. in der Form \( (1+R) = \prod_{t=1}^T (1+r_t)\) ergibt,und damit die „Wirkung der Zufallsänderung also jeweils der zuvor bestehenden Größe proportional ist“

so folgt die Jahresrendite tatsächlich approximativ der gewünschten Lognormalverteilung (Satz über den zentralen Grenzwert). Die Punkte 3 und 4 erwähnt Huber nicht, sie sind jedoch Voraussetzung für die Anwendbarkeit des CLT (Central Limit Theorem = Satz über den zentralen Grenzwert = Zentraler Grenzwertsatz = ZGWS).

Somit gilt die Lognormalverteilung aber eben nur, wenn die Punkte 1–5 tatsächlich erfüllt sind, und nicht im Handstreich und ganz allgemein bei allen wirtschaftlichen Vorgängen wie von Huber im nächsten Satz behauptet:

Bei wirtschaftlichen Vorgängen ist das die logarithmische Normalverteilung (in der Folge LogNV), die nach einheitlicher Meinung der Lehre231 bei wirtschaftlichen Vorgängen vorherrscht.

Hubers Verständnisproblem scheint insbesondere darin zu liegen, was es bedeutet, wenn die Zufallsgrößen „multiplikativ zusammenwirken“ und was es heißt, dass die „Wirkung der Zufallsänderung also jeweils der zuvor bestehenden Größe proportional“ sein muss. Nahezu wortidentisch findet sich der Satz in Sachs (2002, S. 173, Randziffer 139; ich konnte keine ältere Auflage beschaffen):

Die Entstehung einer logarithmischen Normalverteilung, kurz Lognormalverteilung genannt, kann darauf zurückgeführt werden, daß viele Zufallsgrößen MULTIPLIKATIV zusammenwirken, die Wirkung einer Zufallsänderung also jeweils der zuvor bestehenden Größe proportional ist.

Die  nahezu wortgleiche Übernahme ohne Kennzeichnung der Quelle ist ein schwerer Verstoß gegen die Grundsätze wissenschaftlichen Arbeitens. Außerdem verkennt Huber (2004), weshalb Sachs das Wort multiplikativ derart deutlich hervorgehoben hat: auf die Gefahr hin mich zu wiederholen, es muss die interessierende Zufallsgröße als (mathematisches, nicht als umgangssprachliches) Produkt vieler Zufallsgrößen mit bestimmten Eigenschaften darstellbar sein.

Hubers falsche Interpretation von Sachs Aussage scheint dann zu sein: das muss alles irgendwie zusammenwirken (also umgangssprachlich ein Produkt/Ergebnis vieler Faktoren/Elemente sein), damit die Lognormalverteilung resultiert. Was in der statistischen Literatur jedoch steht ist: wenn

$$ \{x_n\}$$

eine Folge (bedeutet: nach \(x_i\) kommt immer noch ein \(x_{i+1}\)) stochastisch unabhängiger und identisch verteilter Zufallsvariablen mit

$$\mathcal{E}[x_i] = \mu, \mathcal{V}[x_i] = \sigma^2, \textrm{ jeweils } < \infty$$

ist, dann folgend aus CLT von Lindeberg (1922), kompakter nachzulesen in Feller (1968, S. 244ff.), ist (über Logarithmierung und unter einigen weiteren, in diesem Zusammenhang meist erfüllten, Voraussetzungen)

$$ \prod_{i=1}^n x_i \sim \mathcal{LN}(\theta).$$

Wobei \(\mathcal{LN}(\theta)\) die Lognormalverteilung mit den Parametern \(\theta\) darstellt. Der Ausdruck lässt sich auch wie folgt darstellen

$$ \prod_{i=1}^n x_i =  x_1 \times x_2 \times \dots \times x_n$$

und hier sieht man auf der rechten Seite des Gleichheitszeichens am Beispiel von \(x_1\) und \(x_2\)

  1. das multiplikative Zusammenwirken, denn \(x_1\) und \(x_2\) sind durch ein Multiplikationszeichen verknüpft,
  2. bei dem die „Wirkung der Zufallsänderung … der zuvor bestehenden Größe proportional“ ist: \(x_1\) ist die zuvor bestehende Größe, \(x_2\) ist eine Zufallsänderung und wirkt durch die Multiplikation proportional zu \(x_1\).

Der Regierungsrat Huber scheint hier den Unterschied zwischen seinem Sprachverständnis und der Exaktheit der Sprache in der methodischen Literatur nicht erkannt zu haben.

Hierdurch wird jegliche weitere Beschäftigung mit seiner (Huber 2004, Abschnitt 5.3.3.7) „Analyse der Verteilungsstruktur von Tageseinnahmen“ weitgehend wertlos, da die Grundlagen bereits falsch sind.

3 Fazit

Das Huber’sche Vorgehen ist im Rahmen der Betriebsprüfung nur dann zu akzeptieren, wenn der Prüfer deutlich darlegen kann, dass die o.g. Punkte 1–5 als erfüllt vorausgesetzt werden dürfen. Kann er dies nicht, so ist der Test zwar technisch durchführbar, das Ergebnis ist aber vollkommen wertlos. Meistens dürfte es bei der Anwendung auf Tagesumsätze bereits daran scheitern, diese als Produkt in der Form \(\prod_{n=1}^N(\dots)_n\) schreiben zu können, da sich Tagesumsätze nunmal als Summe von Einzelumsätzen und nicht als Produkt von Einzelumsätzen ergeben. Sollte es doch einmal möglich sein, so ergeben sich strenge Anforderungen an die Gruppierung der Daten.

4 Auswirkungen auf die einschlägige Literatur

Aufgegriffen wird Hubers Irrmeinung in Simon Raus Diplomarbeit Statistisch-mathematische Methoden der steuerlichen Betriebsprüfung und die Strukturanalyse als ergänzende Alternative. Auf diese Arbeit hat sich der Betriebsprüfer in unserem Fall bezogen, um die Validität seines Vorgehens zu untermauern. Der Autor argumentiert im Abschnitt 4.3.2.2 zu Gunsten(?) Hubers wie folgt:

Zusammenfassend kann festgehalten werden, dass E. Huber sich mit seiner Annahme, dass sich Tageslosungen an einer logarithmischen Normalverteilung orientieren, auf praktische Prüfungsfälle beruft. H. Gebbers und G. Pflug schließen das Vorliegen einer logarithmischen Normalverteilung nicht aus, fordern aber empirische Überprüfungen der Annahme. P. Hackl und S. Frühwirt-Schnatter erkennen an, dass Wirtschaftsdaten häufig durch eine logarithmische Normalverteilung beschrieben werden können. Beide sehen darin allerdings keine Gesetzesmäßigkeit, die auch für Tageslosungen gelten muss. P. Hackl räumt lediglich ein, dass „bestenfalls ausnahmsweise“ eine logarithmische Normalverteilung bei Tageslosungen vorliegen kann. Als Hauptkritikpunkt nennt er die Tatsache, dass die Tageslosungen nicht aus multiplikativ zusammenwirkenden Zufallsfaktoren entstehen. Er entkräftet diesen Kritikpunkt jedoch selbst, indem er anführt, dass Tageslosungen u.a. durch die Multiplikation von Preisen und Mengen entstehen. Dieser Tatsache gesteht er allerdings keine Aussagekraft zu. Hierin liegt eine innere Unstimmigkeit in seiner Argumentation. Deshalb kann der Argumentation von E. Huber gefolgt werden. Die theoretisch anzutreffende Verteilung bei Tageseinnahmen kann die logartihmische Normalverteilung sein. Um aber eine generelle und abschließende Aussage darüber treffen zu können, ob die theoretische Verteilung von Tageseinnahmen sich einer logarithmischen Normalverteilung annähert, bedarf es wissenschaftlicher Studien.

Mir ist nicht genau klar, was Rau hiermit aussagen will. Wir stellen fest: Die Gutachter sagen, Hubers Annahme (dass Tagesumsätze lognormalverteilt sind) kann, muss aber nicht, wird eher selten zutreffen:

H. Gebbers und G. Pflug schließen das Vorliegen einer logarithmischen Normalverteilung nicht aus, fordern aber empirische Überprüfungen der Annahme. P. Hackl und S. Frühwirt-Schnatter erkennen an, dass Wirtschaftsdaten häufig durch eine logarithmische Normalverteilung beschrieben werden können. Beide sehen darin allerdings keine Gesetzesmäßigkeit, die auch für Tageslosungen gelten muss. P. Hackl räumt lediglich ein, dass „bestenfalls ausnahmsweise“ eine logarithmische Normalverteilung bei Tageslosungen vorliegen kann. Als Hauptkritikpunkt nennt er die Tatsache, dass die Tageslosungen nicht aus multiplikativ zusammenwirkenden Zufallsfaktoren entstehen.

Die Voraussetzungen, wann es zutrifft, habe ich oben dargestellt (Punkte 1–5). Rau behauptet dann, sobald auch nur irgendeine Multiplikation (Preis × Menge) in der Entstehung der Tagesumsätze vorliegt, entkräfte dies das Argument, dass die Lognormalverteilung nur in Ausnahmefällen zutrifft:

Er entkräftet diesen Kritikpunkt jedoch selbst, indem er anführt, dass Tageslosungen u.a. durch die Multiplikation von Preisen und Mengen entstehen.

Deshalb könne Huber, der — wir erinnern uns — die Lognormalverteilung für gottgegeben für Tagesumsätze hält, gefolgt werden:

Deshalb kann der Argumentation von E. Huber gefolgt werden.

Dennoch benötigten wir weitere Studien:

Um aber eine generelle und abschließende Aussage darüber treffen zu können, ob die theoretische Verteilung von Tageseinnahmen sich einer logarithmischen Normalverteilung annähert, bedarf es wissenschaftlicher Studien.

Die Anzahl der gedanklichen Fehler in diesem kurzen Absatz ist erheblich.

  1. Die Gutachter formulieren mathematisch genau die Voraussetzungen für das Vorliegen einer Lognormalverteilung. Dies sind eben die obigen Punkte 1–5. So ist es auch, zwar in Prosa und nicht in Formeln, in der Entscheidung des UFSW (S. 128–136) wiedergegeben.
  2. Dies scheint Rau zu entgehen, so wie er auch in seiner gesamten Arbeit auf die dringend notwendige Darstellung der Grundlagen der mathematischen Statistik für die Verfahren verzichtet.
  3. Dann folgert Rau „irgendwas ist ein Produkt“ \(\rightarrow\) „Gutachter liegen falsch.“
  4. Deswegen habe Huber Recht (k.A. wie ich „kann der Argumentation … gefolgt werden“ sonst interpretieren soll).
  5. Aber auch wieder nicht soviel Recht, dass wir nicht weitere wissenschaftliche Studien benötigten.

Die Unstimmigkeit ist selbst ohne höheren Bildungsabschluss leicht zu erkennen. Inhaltlich liegt Rau auch mit seiner Forderung nach weiteren Studien falsch: Wann die Lognormalverteilung approximativ gilt, ist seit dem Satz über den zentralen Grenzwert (Lindeberg 1922) bekannt. Es ist nun nur noch Aufgabe des Anwenders, zu zeigen, dass die Voraussetzungen vorliegen, und das ist hier — anscheinend Wunschergebnisse verhindernd — schwierig.

Literatur

Feller, William. 1968. An introduction to probability theory and its applications (Vol. 1). John Wiley & Sons.

Huber, Erich. 2004. Die neue Prüfungstechnik in der Betriebsprüfung. Wien: LexisNexis.

Lindeberg, Jarl Waldemar. 1922. „Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung.“ Mathematische Zeitschrift, 15 (1), 211-225.

Rau, Simon. 2012. Statistisch-mathematische Methoden der steuerlichen Betriebsprüfung und die Strukturanalyse als ergänzende Alternative. Lohmar: Eul.

Sachs, Lothar. 2002. Angewandte Statistik. 10. Auflage. Berlin: Springer