Vai al contenuto

Funzioni a scalini

10 novembre 2015

Ci servono delle funzioni a gradini. Le usiamo per scendere e sono costanti a tratti.

I tratti verticali sono colorati per figura, anche se non appartengono alle funzioni ma sono regioni di discontinuità. Il numero di discontinuità è pari, il numero di gradini è dispari e nel gradino intermedio la funzione vale zero. Quello intermedio può essere l’unico gradino della funzione, che allora non ha discontinuità.

L’altezza dei gradini è unitaria. La lunghezza di ogni gradino è un numero intero positivo.

Quante funzioni possiamo disegnare nell’intervallo tra 0 e 11?

Funzioni a scalini


Quante funzioni tra 0 e 11 sono costanti a tratti di lunghezza intera positiva, sono monotone decrescenti, hanno un numero dispari di tratti e nel tratto intermedio valgono 0?

Strisce colorate che si intrecciano

3 novembre 2015

Abbiamo a disposizione quattro strisce di carta in quattro colori diversi, rosso, giallo, verde e blu. Dopo aver chiuso ad anello ogni striscia, la si schiaccia in modo da avere un doppio rettangolo di carta, tre volte più lungo che largo.

Questi rettangoli possono essere inseriti l’uno dentro l’altro, facendo attenzione a che ciascuno sia contemporaneamente dentro il precedente e attorno al successivo. Possiamo così incastrare i rettangoli tra di loro.

Mantaniamo i rettangoli sempre allineati agli assi cartesiani, due orizzontali e due verticali, e facciamo combaciare ogni rettangolo con tre caselle di un’ideale scacchiera. Ogni rettangolo occuperà una casella in completa autonomia, e altre due in compresenza con altri rettangoli, una volta coprendo e una volta coperto. Questa situazione non cambia facendo scorrere il rettangolo di una casella tenendo immobili gli altri.

Passiamo da una configurazione all’altra solo con il movimento di un rettangolo per volta. E’ possibile ottenere in sequenza tutte le disposizioni per poi tornare a quella di partenza?

E se i rettangoli fossero 8, ciascuno lungo 5?

Strisce colorate che si intrecciano


Si possono ottenere in sequenza tutte le combinazioni di 8 lampadine, azionandone solo una per volta e ritornando alla sequenza di partenza?

Passo doppio binario

27 ottobre 2015

Ecco 10 scacchiere. L’ottava è, di tutte, quella più famigliare. Non che le altre abbiano forme strane o irregolari. Sempre quadrati divisi in quadrati. Il numero di quadrati per lato, però, varia tra 1 e 10. Vanno in scala come una serie di stampi per budini.

Non importa se c’è anche una “scacchiera” che ha solo una riga e una colonna, l’importante è partecipare.

Tanto poi alla fine ne useremo solo una, sulla quale la nostra unica pedina avrà un unico tipo di movimento, il passo doppio binario.

Il passo doppio binario è un movimento composito, che consiste nel percorrere una casella disegnando un binario, sostare sulla casella di riposo, percorrere una terza casella disegnando un secondo binario e arrestarsi nella quarta casella. Tutti gli eventuali binari già presenti sulla scacchiera devono essere percorsi così come sono stati tracciati e si aggiungono ai tre tempi del passo doppio binario.

La realtà è piena di cavilli. Eccoli:

(1) la pedina si suppone posizionata su una casella, e si sceglie una delle quattro direzioni su, giù, destra o sinistra.

(1a) alla pedina non è concesso tornare sui suoi passi, quindi se proviene da una certa casella non può fare dietro front. Potrà cambiare direzioni alle mosse successive, ma un movimento verso l’alto non può essere immediatamente annullato da un movimento verso il basso.

(1a) la pedina non può uscire dalla scacchiera, quindi se è su una casella periferica avrà possibilità di movimento ridotte.

(2) la pedina si sposta nella nuova casella adiacente alla prima.

(3) si ripetono i punti precedenti altre tre volte, in modo che la pedina avrà attraversato tre caselle, diciamo la A e la B e la C, per poi terminare la sua corsa nella D.

(4) sulle caselle A e C si costruiscono dei binari secondo il movimento della pedina.

(4a) una casella contenente un binario può essere attraversata solo percorrendolo.

(4b) attraversare una pedina contenente un binario non conta come parte del movimento.

Scegliamo una casella a caso tra le 385 delle 10 scacchiere di cui sopra e adagiamoci sopra la pedina. Qual è la probabilità di coprire interamente la scacchiera di binari?

Passo doppio binario


Si sceglie una casella a caso tra quelle di 10 scacchiere di lato 1, \ldots, 10. Da qui, si muove una pedina con mosse composite di 4 parti, ciascuna parte sposta senza inversioni di moto in una casella adiacente ortogonale. Il passaggio per caselle già attraversate in parti di mossa dispari non viene conteggiato e può essere fatto solo seguendo la direzione del primo passaggio. Qual è la probabilità che sia possibile attraversare in parti di mossa dispari tutte le caselle della scacchiera?

Ipercubi che lasciano il segno

20 ottobre 2015

Riprendo un post di qualche anno fa e lo generalizzo. L’idea non è eccessivamente difficile, come invece lo è il descriverla. Potrei avere difficoltà a raccontare di spazi Euclidei a n dimensioni. In questi casi c’è sempre il pericolo che l’intuizione inciampi, ma lascio al volenteroso lettore che ha compreso il mio intento, il compito di indicarmi la strada corretta o una scorciatoia.

Nel post originario consideravo due cubi, ciascuno dei quali aveva un vertice coincidente col centro dell’altro. Il solido ottenuto dalla loro unione è facilmente visualizzabile, e ne proponevo lo sviluppo in modo da poterlo creare ritagliando un foglio di carta. In alternativa si può anche costruire l’oggetto incollando 15 cubetti uguali formando due cubi 2\times 2\times 2 con un cubetto in comune.

Il quesito era pertinente alle tre dimensioni: qual è il volume da aggiungere alla figura per renderla convessa?

Mi cimento ora nel mostrare una generalizzazione in n dimensioni. Non è detto che non si possa estendere il problema in altri modi, o che quello che qua presento sia il più naturale. La strada che ho seguito è quella di catturare uno degli aspetti del problema, che trovo particolarmente interessante, e di applicarlo in più dimensioni.

Invece di pensare a due cubi che si toccano, la figura può essere costruita immaginando un cubo solo che trasla nello spazio. Tutti i punti che tocca durante la traslazione, ma che non appartengono né alla posizione iniziale né a quella finale, concorrono alla formazione del volume da aggiungere alla figura per renderla convessa.

Da qui in avanti, sottintendiamo l’unità di misura, che sarà una generica u per misure lineari, u^2 per superfici e così via. Ragioniamo in due dimensioni, immaginando un quadrato di lato 2. Dalla posizione iniziale a quella finale, il quadrato si sposta in direzione (1, 1).

La parte di piano attraversata dal quadrato è costituita da due triangoli, ed è facile calcolare in modo diretto la loro area. Insieme formano un quadrato di area 1, un quarto del quadrato che si è mosso.

Tra i vari modi di calcolare l’area di questi triangoli, ne propongo uno un po’ più contorto ma che tornerà utile. Nel movimento, ci sono solo due dei quattro lati del quadrato che “spazzano” il piano. La parte di piano che spazzano non si sovrappone, e forma sia i triangoli, di area T, sia tutto il quadrato in posizione di arrivo, di area 4, tranne l’intersezione con il quadrato in posizione di partenza, intersezione che ha area 1. In totale questa parte di piano ha area 4, quindi

4 = T + (4 - 1),

da cui T=1.

Come faccio a sapere che la parte di piano spazzata ha area 4? Per prima cosa perché quest’area si divide a metà in due parallelogrammi simmetrici, che posso “raddrizzare” mantenendo inalterata l’area (principio di Cavalieri) per ottenere due rettangoli. E poi l’area di ciascun rettangolo si calcola moltiplicando la base, che è il segmento lungo 2, per l’altezza, che è la componente del vettore spostamento ortogonale alla base e che è lunga 1.

Questo approccio per il calcolo di T può essere esteso in n dimensioni. La strategia così come è delineata è quella di estendere l’area spazzata, l’area del quadrato in posizione di destinazione e l’area dell’intersezione, in modo da determinare T per differenza.

I due elementi più semplici sono gli ultimi due. Intanto l’oggetto che si muove, e che in una dimensione è un segmento, in due un quadrato e in tre un cubo diventa un n-cubo, o ipercubo. Il suo volume è dato da 2^n, giacché ogni dimensione è ortogonale alle altre, e tutti i lati sono uguali.

L’intersezione è 1, alias 1^n. Sembra paradossale perché resta costante mentre il volume degli ipercubi cresce a dismisura. Molto curioso, se si pensa che questa intersezione tocca comunque i centri degli n-cubi.

Adesso passiamo al calcolo del volume spazzato. Questo è determinato da metà delle facce dell’n-cubo, che sono n. Il numero di facce totali è 2n, perché per ciascuna dimensione ci sono due facce ad essa ortogonali.

Ogni faccia ha superficie 2^{n-1}. Nel piano è il segmento lungo 2, nello spazio un quadrato di area 4, in quattro dimensioni è un cubo di volume 8 e così via.

Prima intuizione: il volume spazzato si ottiene come base per altezza. L’altezza è unitaria, essendo la componente del vettore spostamento ortogonale alla base. Quindi l’area totale è

n \cdot 2^{n-1}.

Seconda intuizione: il volume spezzato rispetta il principio di Cavalieri e può essere richiuso a formare l’n-cubo in posizione di arrivo.

Mettendo insieme i pezzi,

n \cdot 2^{n-1} = T + (2^n - 1),

e allora

T = 2^{n-1} \cdot (n - 2) + 1,

che per n \geq 1 inizio con

T = 0, 1, 5, 17, 49, 129, 321, 769, 1793, 4097.

Il primo caso è degenere: traslando un segmento lungo 2 per un tratto lungo 1 abbiamo due segmenti che si sovrappongono, e non si deve aggiungere nulla per ottenere la convessità.

Il caso 2D è quello dimostrato nell’articolo, e per il caso 3D si rimanda all’articolo citato all’inizio. Per le altre dimensioni mi appoggio alle due intuizioni di cui sopra. Starà in piedi tutto il ragionamento?

Cerchi e quadrati

13 ottobre 2015

E a te cosa piacciono di più, i cerchi o i quadrati? A mia discolpa i cerchi già esistevano, quando sono nato. E poi l’unica cosa che ho imparato è che nella vita si scrive senza apostrofo.

Il cerchio iniziale ha un suo fascino. Di raggio unitario, possiamo anche già fare che centrarlo nell’origine. Anche il quadrato in cui è iscritto non è malaccio. Se non ci scandalizziamo troppo possiamo dire che ha raggio unitario anche lui, ma basta inclinare solo un po’ la testa, 45 gradi posson bastare, per giurare che forse il suo raggio è \sqrt{2}. Questione di punti di vista. Già che ci siamo il cerchio lo chiamiamo C_1, mentre al quadrato faremo riferimento con una perifrasi.

Concentriamoci su uno dei quattro vertici del quadrato. Fissiamo questo punto molto intensamente e sentiamoci sempre più rilassati. Usiamo questo punto come centro per tracciare un cerchio, C_2, tangente a C_1. Ripetiamo sugli altri tre vertici e abbiamo un totale di quattro nuovi cerchi, che però chiamiamo tutti C_2. Non sta in piedi? Facciamo allora che C_2 è l’insieme dei cerchi di secondo livello. Stiamo raggiungendo uno stato di rilassamento profondo completo. Per dare un tocco di qualità, anche i cerchi C_2 sono ingabbiati da quadrati.

Il cerchio C_1, come metafora del gigante su cui un cerchio C_2 sale in spalla per espandere la frontiera della conoscenza. E ogni cerchio C_2 è a sua volta un gigante per un cerchio C_3, costruito secondo le stesse regole: a esso tangente e centrato nel vertice esterno al centro e sulla bisettrice del quadrato nel quale il cerchio è inscritto. La cultura si approfondisce sempre di più, in un ambito sempre più ristretto. E la sfilza di esperti sempre più esperti e sempre più piccoli continua con i cerchi C_4, C_5, C_6 e andare.

Bene, e con tutto ciò? Torniamo al cerchio iniziale, al suo raggio 1, al quadrato, e al miraggio del suo raggio \sqrt{2}. Segniamo un confine, un cerchio centrato nell’origine e di raggio 1 + \sqrt{2}. Quanti cerchi C_1, C_2, C_3 possiamo disegnare prima di varcare questo confine?

Cerchi e quadrati


Un cerchio C_1 di raggio unitario è inscritto in un quadrato. Si disegna una sequenza di cerchi C_i dove i-esimo è tangente all’i-1-esimo ed è centrato nel vertice più lontano dall’origine del quadrato nel quale è inscritto il cerchio i-1-esimo. Qual è il primo i per cui il cerchio C_i interseca il cerchio concentrico a C_1 e di raggio 1+\sqrt{2}?

Spirale romboidale

6 ottobre 2015

Nelle prime giornate fredde finita l’estate, non c’è niente di più piacevole che dedicarsi a qualche conticino di quelli facili facili che tornano anche senza pensarci troppo. E’ quello che si propone di fare Lorella tirando qualche segmento su un foglio di carta quadrettato.

Il punto di partenza ha coordinate (0, 1). E’ sicuramente un punto di partenza più fortunato di altri, per i quali si ci accontenta di accompagnare con un dito puntato un vago “questo”. E invece il punto di Lorella è proprio questo, proprio ad un centimetro di distanza verso l’alto dall’origine. Con un primo segmento la ragazza lo unisce al punto (1, 0), e poi successivamente congiunge anche i punti (0, -1) e (-1, 0). Tutti punti rispettabilissimi. Con tre segmenti c’è già quasi un rombo.

Il gioco però rischia di finire troppo presto, e dopo questo primo giro quasi completo la ragazza non ritorna al punto iniziale ma decide di congiungere in sequenza altri quattro punti: (0, 2), (2, 0), (0, -2), (-2, 0).

E perché fermarsi? Adesso è la volta di (0, 3), (3, 0), (0, -3) e (-3, 0), e così via.

Dopo un certo numero di giri, è il momento di aggiungere un po’ di colore. Tagliando idealmente la spirale con gli assi cartesiani forma quattro forme triangolari centrali e un bel numero di trapezi. Nel primo quadrante colora una zona sì e una no partendo dalla prima più vicina all’origine, nel secondo parte dalla seconda, nel terzo dalla prima e nel quarto dalla seconda.

L’area totale colorata è di 405 centimetri quadrati. Di quanti segmenti è composta la spirale?


Che emozione: Bash, Eukleides, convert, ed ecco la mia prima gif animata! Nel 2015! Se continua così ancora qualche anno e su Conlemele caricherò file VRML e livelli aggiuntivi di Doom.

spir

Spirale romboidale


Si tracciano n segmenti unendo ordinatamente i punti (0, 1), (1, 0), (0, -1), (-1, 0), (0, 2), \ldots e si colorano partendo dall’origine le zone dispari nei quadranti dispari e pari nei quadranti pari. Le zone colorate hanno area 405, quando vale n?

Palchetto

29 settembre 2015

La stanza è elegante e ristrutturata di recente. Gli elementi di arredo non sono poi molti, qualche armadio, tende, il tavolone centrale. E’ un’aula riunioni.

In questo paragrafo, immaginatevi uno di quei pastoni in cui racconto che una riunione non è necessariamente l’opposto di innovazione, ma critico che le riunioni sono spesso una perdita di tempo, e dove forse poi correggo il tiro e forse no, e magari elevo la riunione a simbolo di pianificazione contrapponendola all’azione, dove convengo sull’utilità di entrambi e finisco col ripetere che la virtù sta nel mezzo, invoco il buonsenso, alieno buona parte dei lettori, faccio a pugni con l’italiano e cose così.

La cosa più bella della stanza è indubbiamente il pavimento in legno, un palchetto con un motivo geometrico abbastanza elaborato da catturare la mia attenzione. Il disegno forma un quadro che si ripete.

I listelli hanno tutti la stessa larghezza, credo per renderne più semplice la realizzazione. Quello che resta del quadro sono quattro quadrati centrali uguali e dodici triangoli laterali.

La dimensione dei quadrati e dei triangoli dipende dalla larghezza dei listelli. Può l’area totale dei quattro quadrati essere la stessa dell’area totale dei dodici triangoli? Se sì, per quante larghezze possibili dei listelli?

Palchetto


Per quanti valori di larghezza dei poligoni arancioni in figura, le aree marroni e gialle si equivalgono?

SQL è disuguaglianza triangolare

22 settembre 2015

In questo articolo intendo, con un esempio tratto dalla mia realtà lavorativa, mostrare un legame inaspettato tra un’applicazione informatica e una teoria matematica. Legami di questo tipo sono talvolta difficili da individuare, perché se da un lato la pratica è travolgente e “sporca”, dall’altro la teoria è complicata e distaccata. Ricondursi ad una teoria comporta solitamente l’astrazione di una situazione concreta, esercizio a volte difficoltoso ma potenzialmente utile perché può dare fondamento a quella che altrimenti è solo un’intuizione.

Parlo di SQL, che è un linguaggio informatico per interrogare (query) database. Per semplicità, consideriamo un database composto da una singola tabella, con un certo numero di righe (record) e un certo numero di colonne (campi). Con l’SQL è possibile effettuare operazioni su tutti i valori presenti in determinati campi, come ad esempio totalizzare il contenuto di un campo numerico o estrarre tutti i valori univoci di un campo alfanumerico.

Supponiamo di avere un database con due campi, uno che presenta n valori distinti e uno che contiene valori numerici sia positivi che negativi. Siano i record del database partizionati sulla base del primo campo, quindi il generico record x appartiene necessariamente ad uno degli insieme A_1, \ldots, A_n, la cui unione determina l’insieme complessivo A.

Un esempio è una tabella contenente tutti i movimenti di cassa di un conto corrente nel corso di un anno. In questo caso n=12, e A_3 rappresenta l’insieme delle righe riferite al mese di marzo. Chiamiamo f(x) il valore numerico del flusso di cassa situato nel record x. Il saldo finale a fine anno è

\sum_{x\in A} f(x),

che è uno dei classici risultati che si possono calcolare agevolmente in SQL.

Poniamo ora di essere interessati al totale delle entrate, vale a dire di ignorare le righe con f(x) negativo. Matematicamente stiamo usando la funzione ()_+, chiamata parte positiva. Si definisce (z)_+ = z se z \geq 0, ed è (z)_+ = 0 se z < 0. Siamo però di fronte ad un ostacolo, perché SQL non calcola la funzione ()_+ sui dati di una singola riga, così come non calcola la funzione \max tra due valori. Al più può trovare il \max tra tutti i valori di un campo, ma la funzione non può essere usata per determinare il massimo tra due numeri, anche perché in caso contrario avremmo potuto scrivere \max(x, 0) invece di ()_+.

E’ anche vero che in SQL si possono fare filtri per escludere i valori negativi, ma nel mio esempio questi valori dovevano essere invece posti a 0. Come fare senza la funzione che calcola la parte positiva? Si dà il caso che in SQL ci sia la funzione \mbox{abs} che calcola il valore assoluto dell’input. Per chi vuole distrarsi, propongo di interrompere la lettura e di provare invece a definire la funzione ()_+ avendo a disposizione solo \mbox{abs} e le quattro operazioni. La soluzione sarà data a tradimento più sotto.

La funzione ()_+ non è lineare, quindi l’applicarla in varie fasi di raggruppamento porta a risultati diversi. Ad esempio la si può applicare a monte, su ogni riga del database, per trasformare in 0 tutte le transazioni negative. La comparazione che mi sono ritrovato a fare prevedeva invece di applicarle in fasi successive di raggruppamento. In un primo caso consideravo solo i saldi mensili positivi, sommandoli poi insieme:

\sum_{i = 1}^n \left( \sum_{x \in A_i} f(x) \right)_+;

un secondo caso considerava il saldo totale solo se positivo:

\left( \sum_{x \in A} f(x)\right)_+ = \left( \sum_{i = 1}^n \sum_{x \in A_i} f(x) \right)_+.

Dalle mie estrazioni sembrava che il primo risultato fosse sempre maggiore o uguale al secondo. E’ sempre vero? Perché? lo si può dimostrare?

Così come descritto, il problema potrebbe sembrare fin troppo semplice, ma è appena il caso di dire che capire cosa stesse succedendo nella situazione reale non era altrettanto palese: molti campi e molte tabelle aggiunte in tempi diversi, una partizione meno visibile rispetto ai mesi di calendario e un significato più articolato di semplici transazioni monetarie contribuivano a confondere le acque. Quindi già la formulazione in termini matematici è stata di grande aiuto.

Per proseguire nell’astrazione, chiamo y_i = \sum_{x\in A_i} f(x), quindi quello che succedeva empiricamente era che

(y_1 + \ldots + y_n)_+ \leq (y_1)_+ + \ldots + (y_n)_+.

Per tornare al problema della mancanza della funzione ()_+ in SQL, una soluzione è scrivere

(x)_+ = \frac{x + |x|}{2}.

Chi si fosse perso l’occasione di trovare autonomamente questa formuletta rimedi ora verificando che sia corretta. Usando questa formula, dobbiamo allora dimostrare che

\frac{y_1 + \ldots + y_n + |y_1 + \ldots + y_n|}{2} \leq \frac{y_1 + \ldots + y_n}{2} + \frac{|y_1| + \ldots + |y_n|}{2},

che equivale a

|y_1 + \ldots + y_n| \leq |y_1| + \ldots + |y_n|,

che è sempre vera!

Quest’ultima equazione è infatti una generalizzazione della disuguaglianza triangolare. Se immaginiamo di avere un poligono di n+1 lati, e di individuare un lato principale, il suo vettore è determinato dalla somma dei vettori di tutti gli altri lati, quindi la sua lunghezza è |y_1 + \ldots + y_n|. Tutti gli altri lati, insieme, determinano una spezzata che connette i due vertici toccati dal lato principale, e che ha lunghezza |y_1| + \ldots + |y_n|. Per definizione il primo segmento, essendo rettilineo, deve connettere i due vertici percorrendo la strada più breve, il che giustifica l’equazione.

Nel nostro caso abbiamo scalari invece di vettori, ma il ragionamento sta in piedi comunque immaginando che siano proiezioni di vettori sulla retta reale. Una dimostrazione rigorosa può ad esempio partire dalla disuguaglianza triangolare base,

|y_1 + y_2| \leq |y_1| + |y_2|,

ed estendere poi il numero di dimensioni tramite ricorrenza. Poiché questa disuguaglianza è vera, diciamo che la funzione valore assoluto è sub-additiva.

In conclusione, il processo di astrazione mi è stato utile sia per apprendere maggiori informazioni sul lavoro che stavo facendo grazie alla sua matematizzazione, sia per validare teoricamente l’intuizione costruita per via empirica che il totale diminuiva con l’aumentare del grado di raggruppamento. Come effetto collaterale, che personalmente non riesco a considerare meno importante, la possibilità di essere coinvolto in un’attività delle più umane: usare il cervello.

Un quesito di maturità scientifica

15 settembre 2015

Per avere un blog di successo ci sono poche e semplici regole, che Conlemele rispetta con precisione scientifica per garantirsi una popolarità da prima serata televisiva: linguaggio chiaro e accessibile, immagini accattivanti, pubblicazioni regolari, temi di attualità concreti che interessano alla gente, commenti e link ad altri blog e una pioggia di gettoni d’oro zecchino come gran premio finale.

E’ per questo che parliamo, a metà settembre, della prova di matematica della maturità scientifica. Yeah. Personalmente non mi è dispiaciuta, ma è anche vero che io non ho dovuto sostenere l’esame. Sono solo un onesto cittadino che paga le tasse e che si scarica i testi della matura e prova a vedere se è capace di risolvere i quesiti.

Tra le dieci domande ne segnalo per gradevolezza due, e ne risolvo una terza. Un primo quesito molto carino chiede di dimostrare la formula per il volume del tronco di cono. Credo che la strada ufficiale sia di interpretarlo come solido di rotazione e calcolare l’integrale, ma non è male dare per nota la formula del volume del cono e vedere il tronco come differenza di due coni con parametri opportuni. E i conti tornano con facili e appaganti calcoli.

Altra segnalazione è per il quesito che dichiara che un triangolo ha lati lunghi 6, 6 e 5, e chiede la probabilità che un punto casuale uniformemente scelto all’interno del triangolo disti più di 2 da uno dei tre vertici. Il triangolo risulta diviso in 4 aree, tre di queste sono “fette di torta” centrate nei vertici del triangolo e di raggio 2. Pensare di calcolare queste tre aree potrebbe impedire completamente la risoluzione del problema, fino a che non si arriva all’illuminazione: non ci servono le tre aree separatamente, ma l’area della torta completa, che guarda caso si trova molto facilmente. (“Torta”, “pie”, \pi, area del cerchio, … adesso tutto torna).

In questo post risolvo invece questo quesito: trova il minimo di

f(x) = (x-1)^2 + (x-2)^2 + \ldots + (x-5)^2.

Non so precisamente di quali strumenti dispone lo studente, una volta finita la quinta, ma per fortuna non riceverò nessun voto.

Approccio algebrico

La funzione ha una discreta simmetria, caratteristica da sfruttare al volo. Per rendere questa simmetria esplicita, definiamo una nuova variabile y=x-3, in modo da scrivere il polinomio equivalente

g(y) = (y-2)^2 + (y-1)^2 + y^2 + (y+1)^2 + (y+2)^2.

La trasformazione è una traslazione orizzontale che non cambia il valore del minimo.

Sviluppando i quadrati si elidono tutti i doppi prodotti, e quindi

g(y) = 5y^2 + 2(2^2+1) = 5y^2 + 10.

La funzione è sempre positiva, quindi il minimo si ha per y=0=x-3, cioè per \hat{x}=3, dove il cappello sopra la x indica che per quel valore la funzione è minima. E vale f(\hat{x}) = 10.

Ottimizzazione

Forse la strada che un bravo studente avrebbe dovuto seguire è quella dell’ottimizzazione, ponendo a zero la derivata prima:

f' = \sum 2(x-i) = 2\cdot 5\cdot x - 2 \sum i = 10x - 30 = 0.

I calcoli sono semplicissimi, e il risultato è lo stesso di prima.

Perturbazione

Confesso di essermi scervellato per trovare il minimo in modo alternativo. Dopo un po’ di tentativi andati a buca, ecco che ho completato il metodo che segue, che ad un’analisi più attenta risulta non essere altro che l’azzeramento della derivata prima ma con un approccio meno generale e un po’ rétro.

Consideriamo la generalizzazione della funzione:

f(x) = \sum_{i=1}^n (x-i)^2,

che ha minimo \hat{y} = f(\hat{x}) che ci riproponiamo di trovare.

Con semplici passaggi posso calcolare la funzione in corrispondenza della somma o della differenza di due valori:

f(a \pm b) = \sum (a \pm b - i)^2 = \sum(a-i)^2 + \sum b^2 \pm 2b\sum(a-i).

E qua il punto fondamentale è che la nostra funzione si comporta molto bene, perché nel primo addendo a destra ritroviamo f(a). Gli altri due addendi sono rispettivamente nb^2 e 2b\left(na - n\frac{n+1}{2}\right), quindi per riassumere

f(a\pm b) = f(a) + nb \left(b \pm \left( 2a - (n+1)\right)\right).

Armati di questo calcolo, possiamo pensare di calcolare la funzione un po’ a destra e un po’ a sinistra di \hat{x}, scrivendo

f(\hat{x} \pm \epsilon) = f(\hat{x}) + n \epsilon(\epsilon \pm (2\hat{x} - (n+1))) \geq f(\hat{x}),

dove per definizione di minimo, allo spostarci di un qualsiasi \epsilon \geq 0 da \hat{x} otteniamo un valore non inferiore a f(\hat{x}). Da questa disuguaglianza, e siccome anche n\epsilon è non negativo, deduciamo che la parte tra le parentesi più esterne deve essere non negativa:

\epsilon \pm (2\hat{x} - (n+1)) \geq 0,

il che, separando i due casi contenuti in \pm, ci porta a dire

\frac{n+1}{2} - \frac{\epsilon}{2} \leq \hat{x} \leq \frac{\epsilon}{2} + \frac{n+1}{2}.

Questo vale per ogni \epsilon quindi abbiamo rinchiuso \hat{x} in un intervallo piccolo a piacere. Per \epsilon = 0 troviamo

\hat{x} = \frac{n+1}{2},

che concorda con i calcoli precedenti per n=5 e che, a giudicare dalla simmetria della funzione, si poteva giudicare ovvio. In matematica, con gli “ovvio” ci riempono le fosse.

Intersezioni di cerchi, e poi di ipersfere

8 settembre 2015

Questo è il seguito di qualcosa iniziato molti mesi fa. A gennaio di quest’anno ho ricevuto da un lettore di questo blog, come dono inatteso, un problemino simpatico che ho pensato bene di generalizzare. Dopo un periodo passato a menare il can per l’aia, a guardare l’erba crescere e l’acqua evaporare, ecco che mi decido a riprenderlo in mano. Se continuo a non oliarli, certi ingranaggi continueranno a girare molto lentamente.

Per cominciare, ecco come si presentava il problema originario. Ho un quadrato di lato unitario. Ho un cerchio di raggio unitario centrato in un vertice, e un cerchio di raggio un mezzo centrato in uno dei segmenti non contenti il vertice. Si tratta di trovare le coordinate del punto di intersezione dei due cerchi.

Non ci sono trucchetti: il punto di intersezione richiesto è quello interno al quadrato, non quello coincidente con un suo vertice.

Il problema è piacevole da risolvere, sia perché si fanno i calcoli e si trova la soluzione, sia perché questa soluzione, cioè le coordinate del punto, è espressa da numeri “piacevoli”. Non che i numeri irrazionali siano “spiacevoli” o cose del genere, ma insomma uno può anche avere delle preferenze. E comunque no, la soluzione non la scrivo in chiaro, anche perché chi vuole può risolvere questo ed evitare l’orrore multidimensionale che segue.

La costruzione geometrica può essere interpretata in un altro modo, e qui serve un po’ di attenzione e di immaginazione. Siamo all’origine del sistema di riferimento. Ci spostiamo lungo l’asse delle x e disegniamo una circonferenza di raggio 1. Poi ci spostiamo lungo l’asse delle y e disegniamo una circonferenza di raggio \frac{1}{2}.

Con questa idea siamo pronti a generalizzare ad uno spazio euclideo ad n dimensioni. Partendo dall’origine, ci muoviamo lungo il primo asse e disegniamo una sfera di raggio 1 che dista 1 dall’origine. Muovendoci lungo il secondo asse di \frac{1}{2} dall’origine disegniamo una sfera di raggio \frac{1}{2}. Sul terzo asse, raggio e distanza sono \frac{1}{4} e così via. Ogni raggio è la metà del precedente ed è pari alla distanza del centro, di modo che tutte le sfere passano per l’origine. In simboli, l’i-esima ipersfera ha raggio 2^{i-1}.

In n dimensioni, le ipersfere si incontrano tutte in un altro punto con n coordinate positive. La somma di queste coordinate diminuisce con il crescere del numero delle dimensioni. Se questa somma scende al di sotto di uno su 171, quanto vale n?

Intersezioni di cerchi, e poi di ipersfere


Ci sono n ipersfere in \mathbb{R}^n, l’i-esima ha raggio r_i=2^{i-1} e centro sull’i-esimo asse, ad una distanza di +r_i dall’origine. La somma delle coordinate del punto di intersezione delle ipersfere nell’ortante positivo è inferiore a \frac{1}{171}. Quanto vale al minimo n?