Algorithm 版 (精华区)

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: Can machine think? -------by Alan Turing(6)
发信站: 哈工大紫丁香 (2001年06月14日15:57:42 星期四), 站内信件

7 Learning Machines
The reader will have anticipated that I have no very convincing arguments of a
positive nature to support my views. If I had I should not have taken such pa
ins
to point out the fallacies in contrary views. Such evidence as I have I shall
now give.
Let us return for a moment to Lady Lovelace's objection, which stated that the
machine can only do what we tell it to do. One could say that a man can 'inje
ct'
an idea into the machine, and that it will respond to a certain extent and then
drop into quiescence, like a piano string struck by a hammer. Another simile
would be an atomic pile of less than critical size: an injected idea is to
correspond to a neutron entering the pile from without. Each such neutron will
cause a certain disturbance which eventually dies away. If, however, the size
 of
the pile is sufficiently increased, the disturbance caused by such an incoming
neutron will very likely go on and on increasing until the whole pile is
destroyed. Is there a corresponding phenomenon for minds, and is there one for
machines? There does seem to be one for the human mind. The majority of them
seem to be 'sub-critical', i.e. to correspond in this analogy to piles of
sub-critical size. An idea presented to such a mind will on average give rise
 to
less than one idea in reply. A smallish proportion are super-critical. An idea
presented to such a mind may give rise to a whole 'theory' consisting of
secondary, tertiary and more remote ideas. Animals minds seem to be very
definitely sub-critical. Adhering to this analogy we ask, 'Can a machine be m
ade
to be super-critical?'
The 'skin of an onion' analogy is also helpful. In considering the functions of
the mind or the brain we find certain operations which we can explain in purely
mechanical terms. This we say does not correspond to the real mind: it is a s
ort
of skin which we must strip off if we are to find the real mind. But then in
what remains we find a further skin to be stripped off, and so on. {p.455}
Proceeding in this way do we ever come to the 'real' mind, or do we eventually
come to the skin which has nothing in it? In the latter case the whole mind is
mechanical. (It would not be a discrete-state machine however. We have discus
sed
this.)
These last two paragraphs do not claim to be convincing arguments. They should
rather be described as 'recitations tending to produce belief'.
The only really satisfactory support that can be given for the view expressed
 at
the beginning of ?6, will be that provided by waiting for the end of the
century and then doing the experiment described. But what can we say in the
meantime? What steps should be taken now if the experiment is to be successful?
As I have explained, the problem is mainly one of programming. Advances in
engineering will have to be made too, but it seems unlikely that these will not
be adequate for the requirements. Estimates of the storage capacity of the br
ain
vary from 1010 to 1015 binary digits. I incline to the lower values and believe
that only a very small fraction is used for the higher types of thinking. Most
of it is probably used for the retention of visual impressions. I should be
surprised if more than l09 was required for satisfactory playing of the
imitation game, at any rate against a blind man. (Note--The capacity of the
Encyclopaedia Britannica, 11th edition, is 2 x l09.) A storage capacity of
l07would be a very practicable possibility even by present techniques. It is
probably not necessary to increase the speed of operations of the machines at
all. Parts of modern machines which can be regarded as analogues of nerve cells
work about a thousand times faster than the latter. This should provide a
'margin of safety' which could cover losses of speed arising in many ways. Our
problem then is to find out how to programme these machines to play the game.
 At
my present rate of working I produce about a thousand digits of programme a d
ay,
so that about sixty workers, working steadily through the fifty years might
accomplish the job, if nothing went into the waste-paper basket. Some more
expeditious method seems desirable.
In the process of trying to imitate an adult human mind we are bound to think a
good deal about the process which has brought it to the state that it is in. We
may notice three components,
    (a) The initial state of the mind, say at birth,
    (b) The education to which it has been subjected,
    (c) Other, not to be described as education, to which it has been subject
ed.
{p.456} Instead of trying to produce a programme to simulate the adult mind,
why
not rather try to produce one which simulates the child's? If this were then
subjected to an appropriate course of education one would obtain the adult
brain. Presumably the child-brain is something like a note-book as one buys it
from the stationers. Rather little mechanism, and lots of blank sheets.
(Mechanism and writing are from our point of view almost synonymous.) Our hope
is that there is so little mechanism in the child-brain that something like it
can be easily programmed. The amount of work in the education we can assume, as
a first approximation, to be much the same as for the human child.
We have thus divided our problem into two parts. The child-programme and the
education process. These two remain very closely connected. We cannot expect to
find a good child-machine at the first attempt. One must experiment with
teaching one such machine and see how well it learns. One can then try another
and see if it is better or worse. There is an obvious connection between this
process and evolution, by the identifications
    Structure of the child machine=Hereditary material
    Changes of the child machine=Mutations
    Natural selection=Judgment of the experimenter
One may hope, however, that this process will be more expeditious than
evolution. The survival of the fittest is a slow method for measuring
advantages. The experimenter, by the exercise of intelligence, should be able
 to
speed it up. Equally important is the fact that he is not restricted to random
mutations. If he can trace a cause for some weakness he can probably think of
the kind of mutation which will improve it.
It will not be possible to apply exactly the same teaching process to the
machine as to a normal child. It will not, for instance, be provided with legs,
so that it could not be asked to go out and fill the coal scuttle. Possibly it
might not have eyes. But however well these deficiencies might be overcome by
clever engineering, one could not send the creature to school with out the ot
her
children making excessive fun of it. It must be given some tuition. We need not
be too concerned about the legs, eyes, etc. The example of Miss Helen Keller
shows that education can take place provided that communication in both
directions between teacher and pupil can take place by some means or other.
{p.457} We normally associate punishments and rewards with the teaching proce
ss.
Some simple child-machines can be constructed or programmed on this sort of
principle. The machine has to be so constructed that events which shortly
preceded the occurrence of a punishment-signal are unlikely to be repeated,
whereas a reward-signal increased the probability of repetition of the events
which led up to it. These definitions do not presuppose any feelings on the p
art
of the machine. I have done some experiments with one such child-machine, and
succeeded in teaching it a few things, but the teaching method was too
unorthodox for the experiment to be considered really successful.
The use of punishments and rewards can at best be a part of the teaching
process. Roughly speaking, if the teacher has no other means of communicating
 to
the pupil, the amount of information which can reach him does not exceed the
total number of rewards and punishments applied. By the time a child has learnt
to repeat 'Casabianca' he would probably feel very sore indeed, if the text
could only be discovered by a 'Twenty Questions' technique, every 'NO' taking
the form of a blow. It is necessary therefore to have some other 'unemotional'
channels of communication. If these are available it is possible to teach a
machine by punishments and rewards to obey orders given in some language, e.g
. a
symbolic language. These orders are to be transmitted through the 'unemotional'
channels. The use of this language will diminish greatly the number of
punishments and rewards required.
Opinions may vary as to the complexity which is suitable in the child machine.
One might try to make it as simple as possible consistently with the general
principles. Alternatively one might have a complete system of logical inference
'built in '(3) In the latter case the store would be largely occupied with
definitions and propositions. The propositions would have various kinds of
status, e.g. well-established facts, conjectures, mathematically proved
theorems, statements given by an authority, expressions having the logical form
of proposition but not belief-value. Certain propositions may be described as
'imperatives'. The machine should be so constructed that as soon as an
imperative is classed as 'well-established ' the appropriate action
automatically takes place. To illustrate this, suppose the teacher says to the
machine, 'Do your homework now'. This may cause "Teacher says 'Do your homework
now' " to be included amongst the well-established facts. Another such fact
might be, {p.458} "Everything that teacher says is true". Combining these may
eventually lead to the imperative, 'Do your homework now', being included
amongst the well-established facts, and this, by the construction of the
machine, will mean that the homework actually gets started, but the effect is
very satisfactory. The processes of inference used by the machine need not be
such as would satisfy the most exacting logicians. There might for instance be
no hierarchy of types. But this need not mean that type fallacies will occur
any
more than we are bound to fall over unfenced cliffs. Suitable imperatives
(expressed within the systems, not forming part of the rules of the system) s
uch
as 'Do not use a class unless it is a subclass of one which has been mentioned
by teacher' can have a similar effect to 'Do not go too near the edge'.
The imperatives that can be obeyed by a machine that has no limbs are bound to
be of a rather intellectual character, as in the example (doing homework) given
above. Important amongst such imperatives will be ones which regulate the order
in which the rules of the logical system concerned are to be applied For at e
ach
stage when one is using a logical system, there is a very large number of
alternative steps, any of which one is permitted to apply, so far as obedience
to the rules of the logical system is concerned. These choices make the
difference between a brilliant and a footling reasoner, not the difference
between a sound and a fallacious one. Propositions leading to imperatives of
this kind might be "When Socrates is mentioned, use the syllogism in Barbara"
 or
"If one method has been proved to be quicker than another, do not use the slo
wer
method". Some of these may be 'given by authority', but others may be produced
by the machine itself, e.g. by scientific induction.
The idea of a learning machine may appear paradoxical to some readers. How can
the rules of operation of the machine change? They should describe completely
how the machine will react whatever its history might be, whatever changes it
might undergo. The rules are thus quite time-invariant. This is quite true. The
explanation of the paradox is that the rules which get changed in the learning
process are of a rather less pretentious kind, claiming only an ephemeral
validity. The reader may draw a parallel with the Constitution of the United
States.
An important feature of a learning machine is that its teacher will often be
very largely ignorant of quite what is going on inside, although he may still
 be
able to some extent to predict his pupil's behaviour. This should apply most
strongly to the {p.459} later education of a machine arising from a
child-machine of well-tried design (or programme). This is in clear contrast
with normal procedure when using a machine to do computations: one's object is
then to have a clear mental picture of the state of the machine at each moment
in the computation. This object can only be achieved with a struggle. The view
that 'the machine can only do what we know how to order it to do',(4) appears
Strange in face of this. Most of the programmes which we can put into the
machine will result in its doing something that we cannot make sense of at all,
or which we regard as completely random behaviour. Intelligent behaviour
presumably consists in a departure from the completely disciplined behaviour
involved in computation, but a rather slight one, which does not give rise to
random behaviour, or to pointless repetitive loops. Another important result of
preparing our machine for its part in the imitation game by a process of
teaching and learning is that 'human fallibility' is likely to be omitted in a
rather natural way, i.e. without special 'coaching'. (The reader should
reconcile this with the point of view on pp. 24, 25.) Processes that are learnt
do not produce a hundred per cent. certainty of result; if they did they could
not be unlearnt.
It is probably wise to include a random element in a learning machine (see
p.438). A random element is rather useful when we are searching for a solution
of some problem. Suppose for instance we wanted to find a number between 50 and
200 which was equal to the square of the sum of its digits, we might start at
 51
then try 52 and go on until we got a number that worked. Alternatively we might
choose numbers at random until we got a good one. This method has the advantage
that it is unnecessary to keep track of the values that have been tried, but
the
disadvantage that one may try the same one twice, but this is not very import
ant
if there are several solutions. The systematic method has the disadvantage that
there may be an enormous block without any solutions in the region which has to
be investigated first. Now the learning process may be regarded as a search for
a form of behaviour which will satisfy the teacher (or some other criterion).
Since there is probably a very large number of satisfactory solutions the ran
dom
method seems to be better than the systematic. It should be noticed that it is
used in the analogous process of evolution. But there the systematic method is
not possible. How could one keep track {p.460} of the different genetical
combinations that had been tried, so as to avoid trying them again?
We may hope that machines will eventually compete with men in all purely
intellectual fields. But which are the best ones to start with? Even this is a
difficult decision. Many people think that a very abstract activity, like the
playing of chess would be best. It can also be maintained that it is best to
provide the machine with the best sense organs that money can buy, and then
teach it to understand and speak English. This process could follow the normal
teaching of a child. Things would be pointed out and named, etc. Again I do not
know what the right answer is, but I think both approaches should be tried.
We can only see a short distance ahead, but we can see plenty there that needs
to be done.

BIBLIOGRAPHY
Samuel Butler, Erewhon, London, 1865. Chapters 28, 24, 25, The Book of the
Machines.
Alonzo Church, An Unsolvable Problem of Elementary Number Theory
American J. of Math., 58 (1936), 345-363.
K. G鰀el, 躡er formal unentscheidbare S鋞ze der Principia Mathematica und
verwandter Systeme, I, Monatshefte f黵 Math. und Phys., (1931), 173-189.
D. R. Hartree, Calculating Instruments and Machines, New York, 1949.
S. C. Kleene, General Recursive Functions of Natural Numbers
American J. of Math., 57 (1935), 153-173 and 219-244.
G. Jefferson, The Mind of Mechanical Man, Lister Oration for 1949
British Medical Journal, vol. i (1949), 1105-1121.
Countess of Lovelace, Translator's notes to an article on Babbage's Analytical
Engine Scientific Memoir (ed. by R. Taylor), vol. 3 (1842), 691-731.
Bertrand Russell, History of Western Philosophy, London 1940.
A M. Turing, On Computable Numbers, with an Application to the
Entscheidungsproblem, Proc. London Math. Soc. (2), 42 (1937), 230-265.
Victoria University of Manchester.

Footnotes
1. Possibly this view is heretical. St. Thomas Aquinas (Summa Theologica, quo
ted
by Bertrand Russell, 1, 480) states that God cannot make a man to have no soul.
But this may not be a real restriction on His powers, but only a result of the
fact that men's souls are immortal, and therefore indestructible.
2. Author's names in italics refer to the Bibliography.
3. Or rather 'programmed in' for our child-machine will be programmed in a
digital computer. But the logical system will not have to be learnt.
4. Compare Lady Lovelace's statement (p.450), which does not contain the word
'only'.

Also on this site, a document by abelard gives a detailed logical analysis of
the relationship between intelligence and Turing's proposed test of intellige
nce
(as outlined in this document).



      Published on the abelard site by permission of Oxford University Press.
      Originally published by Oxford University Press on behalf of MIND (the
      Journal of the Mind Association), vol. LIX, no. 236, pp. 433-60, 1950

email abelard@abelard.org
?abelard, 1999
Last updated 15.11.99
the address for this document is http://www.abelard.org/turpap/turpar.htm
12,046 words
prints as 17 A4 pages (on my printer and set-up)

--

   
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它      

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:204.140毫秒